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中 国 高 性 能 计算 研究 与 应 用 调查 报告 
(1956 至 2011) 
孙 凝 上 晖 


摘要 本 报告 回顾 中 国 高 性 能 计算 机 系统 研发 和 应 用 的 历史 , 介绍 目前 政府 所 支持 的 高 性 能 计算 项 目 、 高 性 
能 计算 中 心 、 主 要 研究 机 构 、 重 要 的 高 性 能 计算 应 用 领域 和 国内 厂家 的 现状 。 从 系统 研制 、 应 用 开发 和 长 
期 规划 方面 ， 国 、 欧 洲 和 日 本 发 达 国 家 的 高 性 能 计算 进行 了 比较 。 此 外 ， 本 报告 还 对 
算 方面 的 技术 和 应 用 发 展 方向 进行 了 预测 。 


1 介绍 


1956 年 在 周恩来 总 理 的 主持 下 制定 了 中 国 《 十 二 年 科学 技术 发 展 规划 》， 选 定 了 “计算 
机 、 电 子 学 、 半 导体 、 自 动 化 ”作为 “发 展 规划 ”的 四 项 紧急 措施 ， 制 定 了 计算 机 的 科研 、 
生产 、 教 育 发 展 计划 ， 中 国 计 算 机 事业 由 此 起 步 。 从 那 时 起 ， 中 国 计 算 机 的 发 展 已 经 历 了 五 
十 五 年 。 不 断 变化 的 应 用 需求 引导 了 高 性 能 计算 机 的 发 展 方向 。 根 据 应 用 需求 的 变化 ， 中 国 
高 性 能 计算 机 的 发 展 可 以 大 致 可 分 为 1956~1990、1990~2005 和 2005 以 来 三 个 阶段 ( 详 见 
本 报告 82 )。 


本 报告 回顾 中 国 高 性 能 计算 机 系统 研发 和 应 用 的 历史 , 介绍 目前 政府 所 支持 的 高 性 能 计 
算 项 目 、 高 性 能 计算 中 心 、 主 要 研究 机 构 、 重 要 的 高 性 能 计算 应 用 领域 和 国内 厂家 的 现状 。 
从 系统 研制 、 应 用 开发 和 长 期 规划 方面 ,与 美国 、 欧 洲 和 日 本 发 达 国 家 的 高 性 能 计算 进行 了 
比较 。 此 外 ， 本 报告 还 对 中 国 在 高 性 能 计算 的 技术 和 应 用 发 展 方向 进行 了 预测 。 


@ 从 20 世纪 50 年 代 起 步 的 中 国 高 性 能 计算 ， 最 初 上 只 面向 国家 战略 需要 。 如 今 ， 这 仍然 是 
高 性 能 计算 非常 重要 的 方面 , 但 商业 方面 的 需求 也 逐渐 占 了 较 大 的 比重 。 西方 国家 对 高 
性 能 计算 长 期 实施 出 口 限 制 ， 这 使 得 国产 的 高 性 能 计算 相关 的 研制 工作 变 得 更 加 紧迫 ， 
国家 也 在 这 方面 投入 了 大 量 的 财力 和 人 力 ， 取 得 了 一 定 的 成 效 ， 如 国产 高 性 能 CPU 和 
超级 计算 机 。 
@ 我 国政 府 在 高 性 能 计算 上 有 持续 且 长 期 的 资助 。 相 关 的 研究 人 员 期 望 有 更 大 力度 的 投入 
和 资助 以 尽快 缩小 与 发 达 国家 的 差距 , 这 也 促进 了 全 国 范围 的 高 性 能 计算 中 心 的 建立 和 
连接 。 这 些 超 算 中 心 将 帮助 培训 专业 的 人 才 使 用 超级 计算 机 并 提高 应 用 水 平 。 据 统计 ， 
目前 我 国 至 少 有 300 所 大 学 有 自己 的 高 性 能 计算 中 心 。 
@ 我 国正 大 力 鼓 励 国 内 企业 研制 和 开发 高 性 能 计算 机 系统 ,如 上 曙光、 联想 、 浪 潮 、 宝 德 等 。 
同时 也 在 努力 推进 自主 的 高 性 能 计算 标准 化 工作 。 
@ 除了 系统 的 研制 工作 , 我 国 也 启动 了 大 量 网 格 计算 和 服务 项 目 ， 如 中 国 国家 网 格 、 中 
教育 和 研究 网 格 。 许多 大 学 和 研究 所 都 开发 相应 的 网 格 应 用 原型 系统 , 达到 了 数据 共享 
的 目的 。 但 构建 分 布 式 计算 环境 这 样 的 网 格 计算 目标 仍然 没有 完全 实现 , 而 且 供 露出 了 
一 些 网 格 中 心 归属 和 管理 上 的 问题 。 
@ 国家 重点 资助 的 高 性 能 计算 项 目 有 : 高 效能 计算 机 、 高 端 容错 计算 机 、 核 心 电 子 器 件 、 
个 人 高 性 能 计算 机 、 高 通 量 计 算 机 。 
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1 本 文 主要 内 容 曾 在 International Journal of High Performance Computing Applications (高 性 能 计算 研究 与 应 
] ) , 24 (4): 363-409 NOV 2010 上 发 表 ， 译 成 中 文 时 针对 国内 读者 做 了 一 些 改动 。 
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@ 主要 的 研究 机 构 有 中 科 院 计算 所 、 江 南 计 算 所 和 国防 科技 大 学 。 

@ 研究 正 逐 渐 向 大 规模 数据 处 理 器 和 高 效 使 用 GPU 等 加 速 硬件 的 方向 发 展 。 

@ 缺乏 真正 的 高 性 能 计算 机 应 用 软件 ， 这 是 政府 决策 层 需要 重点 考虑 的 问题 。 目 前 ， 相 对 
成 功 的 高 性 能 计算 软件 示例 有 : PHG、JASMIN、GeoEast、GRAPES 和 NWP。 

@ 各 种 应 用 领域 中 具备 使 用 高 性 能 计算 机 能 力 的 研究 生 数 量 严重 不 足 。 

@ 一 方面 ， 工 业界 能 够 较 容 易 把 系统 扩展 到 大 规模 ， 如 千 万 亿 次 ; 另 一 方面 ， 大 学 和 研究 
机 构 的 应 用 需求 通常 只 能 扩展 到 百 万 亿 次 ， 二 者 存在 较 大 的 差距 。 石 油 行业 有 点 特殊 ， 

属于 工业 界 用 户 ,航空 航天 是 高 性 能 计算 的 重要 用 户 ， 但 很 大 程度 依赖 政府 的 支持 ， 而 

不 是 经 济 发 展 的 推动 。 物理 和 天 气 预报 的 需求 在 政府 的 支持 下 也 正在 增长 。 其 他 领域 如 

汽车 与 船舶 制造 的 高 性 能 计算 用 户 ， 应 用 规模 都 比较 小 。 新 兴 的 应 用 领域 包括 医疗 、 运 

输 、 金 融和 虚拟 现实 等 。 需 要 特别 关注 的 是 对 在 线 服 务 的 支持 ， 如 搜索 、 购 物 、 游 戏 等 。 

与 情 分 析 也 将 是 重要 的 应 用 。 


@ ”我国 已 经 研制 成 功 了 两 台 干 万 亿 次 超级 计算 机 ， 都 使 用 了 CPU-GPU 异 构 系 统 技术 。 曲 
光 6000 将 采用 国产 的 高 性 能 处 理 器 。 

@ 高 性 能 计算 研究 在 原始 创新 方面 有 待 提高 , 缺乏 长 期 的 规划 和 追随 美国 是 目前 存在 比较 
大 的 问题 。 

@ 未来， 并 行 软件 和 硬件 将 成 为 主流 ， 其 发 展 也 为 我 国 提供 了 赶 超 美国 和 日 本 的 契机 。 国 
产 的 高 性 能 计算 机 已 经 占据 了 TOP500 前 列 ， 未 来 有 望 保 持 这 样 的 势头 。 此 外 ， 我 国 的 


研究 人 员 正 积极 参与 国际 上 Exaflops 计算 的 讨论 , 对 其 挑战 性 问题 以 及 市 场 机 遇 进行 分 
析 。 我 们 有 信心 认为 国产 龙芯 处 理 器 将 成 为 科学 计算 的 主流 平台 。 

@ 我 国 在 众 核 处 理 器 、 并 行 编程 模型 、 并 行 算法 设计 和 系统 容错 方面 也 展开 了 研究 。 

@ ”软件 方面 的 重点 在 于 处 理 和 分 析 大 规模 数据 的 工具 和 应 用 。 


2 中国 高 性 能 计算 的 历史 


本 节 简 单 回顾 中 国 高 性 能 计算 机 发 展 经 历 过 的 历史 阶段 以 及 高 性 能 计算 应 用 早期 发 展 
的 概况 ， 同 时 列 出 了 一 些 重要 的 代表 性 的 计算 机 来 说 明 国产 高 性 能 计算 机 的 发 展 历 程 。 


1956 年 到 1990 年 是 第 一 阶段 ， 高 性 能 计算 机 的 研制 集中 国 绕 国家 战略 应 用 的 需求 进行 
-全 是 这 一 阶段 的 主要 特征 。 这 是 中 国 的 计算 机 从 无 到 有 的 阶段 ， 经 历 了 电子 管 、 晶 体 管 和 集成 
路 三 个 时 代 。 作 为 记述 对 中 华文 明 发 展 起 促进 作用 的 重要 历史 事件 ， 这 一 时 期 的 103 机 、 
104 机 、119 机 、150 机 、757 机 、 银 河 -1 号 巨型 机 、 和 银河 -2 仿真 计算 机 七 台 计 算 机 的 名 
字 铭 刻 在 中 华 世 纪 坛 的 青铜 甬道 铭文 上 。 改 革 开 放 之 前 ， 由 于 国外 对 中 国 进行 封锁 , 满足 国 
家 战略 需求 是 研制 高 性 能 计算 机 的 主要 动因 ， 如 为 了 “两 弹 一 星 ” 的 需要 研制 了 109 两 机 。 
从 1978 年 改革 开放 到 1990 年 是 中 国 开始 从 计划 经 济 向 市 场 经 济 过 渡 的 时 期 ， 政 府 、 企 业 、 
学 校 需要 的 计算 机 已 经 可 以 从 国外 采购 , 但 是 机 器 的 性 能 受 巴 统 组 织 的 限制 。 为 了 满足 国防 
和 一 些 由 国家 主导 的 行业 ， 如 石油 勘探 、 气 象 ， 对 计算 能 力 的 需求 ， 我 国 自行 研制 了 以 向 量 
机 为 主 的 多 台 高 端 计算 机 ， 如 银河 -1 号 、757 机 、 银 河 -2 号 等 。 


1990 年 到 2005 年 是 第 二 阶段 ， 除 了 国家 战略 应 用 和 国家 主导 的 行业 外 ， 越 来 越 多 的 高 
性 能 计算 机 服务 于 国民 经 济 的 各 行 各 业 。 从 20 世纪 90 年 代 开 始 , 由 于 中 国 经 济 的 高 速 发 展 ， 
不 仅 国家 主导 的 行业 产生 了 更 多 的 高 性 能 计算 需求 ,许多 工业 领域 的 应 用 ， 如 汽车 制造 、 船 
舶 设计 、 药 物 设 计 等 ， 也 产生 了 巨大 的 需求 , 同时 ， 由 于 采用 遵循 摩尔 定律 的 商用 微 处 理 器 
和 大 规模 并 行 处 理 技术 , 中 国 的 高 性 能 计算 机 开始 形成 产业 。 旺盛 的 计算 需求 和 日 益 成 熟 的 
高 性 能 计算 机 技术 极 大 地 促进 了 中 国 高 性 能 计算 机 的 发 展 , 继 银河 系列 之 后 ,又 陆续 推出 了 
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曙光 、 神 威 等 系列 产品 ， 形 成 了 国防 科大 、 中 科 院 计算 所 、 江 南 计 算 所 三 个 主要 系统 研制 
位 和 上 曙光、 联想 、 浪 潮 三 个 主要 企业 。 


从 2006 年 开始 进入 了 第 三 阶段 。 越 来 越 多 的 新 型 应 用 产生 了 新 的 需求 ， 如 在 线 视 频 、 
搜索 引擎 、 电 子 商 务 、 电 子 政务 、 网 络 游戏 等 。 国 家 和 地 方 政府 正在 全 国 范围 内 建设 超 算 中 
心 (Supercomputing Center)， 向 政府 、 人 企业、 社会 提供 公共 的 计算 和 数据 资源 。 中 国 普及 而 
完善 的 高 性 能 计算 基础 设施 正在 形成 。 当 前 ， 研 制 与 应 用 百 万 亿 次 、 千 万 亿 次 高 性 能 计算 机 
是 中 国 的 主要 任务 。 


2.1 高 性 能 计算 机 的 里 程 碑 

随 着 电子 工艺 的 发 展 ， 中 国 的 高 性 能 计算 机 经 历 了 电子 管 时 代 、 蝇 体 管 时 代 、 集 成 电路 
时 代 ; 在 并 行 体系 结构 方面 ， 先 后 经 历 了 向 量 机 、 大 规模 并 行 系统 、 机 群 三 个 技术 阶段 。 下 
面 列举 一 些 里 程 碑 式 的 重要 计算 机 。 
2.1.1 1956 一 1980: 起 步 阶段 


二 @ 1958 年 ， 中 国 第 一 台 计 算 机 103 型 计算 机 研制 成 功 ， 运 行 速度 每 秒 1500 次 。 
之 @ 1959 年 ， 中 国 第 一 台大 型 通用 计算 机 104 机 研制 成 功 ， 运 行 速度 每 秒 1 万 次 。 


下 


Q @ 1964 年 ，119 机 研制 成 功 ， 运 行 速度 每 秒 5 万 次 ， 它 是 电子 管 时 代 中 国 最 快 的 计算 
CN 机 。 
@ 1965 年 ， 中 国 第 一 台 唱 体 管 大 型 通用 计算 机 109 乙 机 研制 成 功 ， 运 行 速度 每 秒 6 
万 次 。 


@ 1968 年 ，109 丙 机 研制 成 功 ， 运 行 速度 每 秒 10 万 次 浮 点 运算 ， 为 中 国 “ 两 弹 一 星 ” 
事业 做 出 重要 贡献 ， 被 称 为 “功勋 机 ”。 
1970 年 ， 中 国 第 一 台 小 规模 集成 电路 通用 计算 机 111 机 研制 成 功 ， 运 行 速度 每 秒 
30 万 次 。 

@ 1973 年 ， 中 国 第 一 台 百 万 次 的 集成 电路 计算 机 150 机 研制 成 功 。 
2.1.2 1980 一 2006: 重要 发 展 阶段 

在 此 期 间 中 国 高 性 能 计算 机 百花 齐 放 ， 取 得 了 长 足 的 进步 ， 银河 、 神 威 、 曙 光 三 大 系列 
成 为 中 国 高 性 能 计算 机 的 代表 。 
@ 757 向 量 机 与 KJ8920 

1983 年 研制 成 功 的 757 大 型 向 量 计算 机 ， 浮 点 运算 峰值 每 秒 一 千 万 次 ， 是 当时 中 
国 最 快 的 计算 机 ， 是 中 国 向 量 机 的 开端 ， 历 时 7 年 于 1991 年 完成 的 KJ8920 石油 勘探 
数据 处 理 系 统 是 中 国 最 后 一 台 采 用 大 型 机 (Mainframe) 结构 的 大 型 数据 处 理 系统 ， 它 
配 有 专门 的 石油 应 用 软件 。 这 两 台 系 统 都 是 中 科 院 计算 所 完成 的 。 
@ 银河 系列 

1983 年 ， 银 河 了 号 巨型 计算 机 研制 成 功 ， 它 采用 向 量 结 构 ， 运 算 速 度 达 每 秒 1 亿 
次 , 是 中 国 首 台 亿 次 计算 机 ; 1992 年 , 中 国 第 一 台 10 亿 次 的 银河 开 号 巨型 机 研制 成 功 ; 
1997 年 ， 银 河 一 亚 并 行 巨型 计算 机 研制 成 功 ， 峰 值 性 能 为 每 秒 130 亿 浮 点 运算 ; 2000 
年 ， 银 河 信 超级 计算 机 系统 问世 ， 峰 值 性 能 达到 每 秒 1 万 亿 次 浮 点 运算 。 此 后 ， 国 防 科 
大 继续 研制 了 多 台 具 有 世界 先进 水 平 的 用 于 国防 应 用 的 银河 系列 超级 计算 机 。 


@ 神威 系列 
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1999 年 9 月 ， 神 威 I 号 计算 机 系统 投入 运行 ， 对 社会 开放 ， 峰 值 速度 为 每 秒 3840 
亿 次 浮 点 运算 ， 是 当时 中 国运 算 速 度 最 快 的 高 性 能 计算 机 。 此 后 ,江南 计算 所 研制 了 多 
台 具 有 世界 先进 水 平 的 用 于 国防 应 用 的 神威 系列 超级 计算 机 。 


@ 曙光 系列 


1995 年 ,电光 1000 大 规模 并 行 处 理 系统 研制 成 功 ， 单 精度 每 秒 25.6 亿 次 ， 双 精度 
每 秒 19.2 亿 次 ， 实 际 应 用 运算 速度 达 每 秒 15.8 亿 次 ;1998 年 研制 成 功 电光 2000-I， 采 
用 机 群体 系 结构 ， 系 统 峰值 速度 为 每 秒 200 亿 次 ，1999 年 研制 成 功 曙 光 2000-II， 系 统 
峰值 速度 为 每 秒 1117 亿 次 ; 2000 年 曙光 3000 研制 成 功 ， 采 用 SMP* 机 群体 系 结构 ， 系 
统 峰 值 速度 为 每 秒 4032 亿 次 ; 2003 年 , 明光 4000L 研制 成 功 , 峰值 速度 每 秒 3 万 亿 次 ; 
2004 年 ， 上 曙光 4000A 研制 成 功 ， 峰 值 速度 每 秒 11 万 亿 次 ， 使 中 国 首次 进入 国际 超级 计 
算 机 TOP10， 使 中 国 成 为 继 美国 、 日 本 之 后 第 三 个 能 研制 十 万 亿 次 级 商品 化 高 性 能 计 
算 机 的 国家 。 中 科 院 计算 所 研制 的 曙光 系列 ， 十 年 左右 时 间 性 能 提高 了 工 万 倍 。 


2.1.3 2006 一 现在 : 百 万 亿 次 到 千 万 亿 次 的 跨越 


~ @ 2008 年 ， 映 光 5000 峰值 230TFlops ， 当 年 在 TOP500 排名 第 十 ， 成 为 亚洲 最 快 的 

人 -~ 超级 计算 机 。 同 时 ， 联 想 公司 研制 了 100TFlops 的 深 腾 7000。 

@ 2009 年 10 月 ， 国 防 科 大 研制 了 天 河 -1，Linpack 峰值 563.1TFlops， 在 TOP500 排 
名 第 5。 

@ 2010 年 6 月， 中科院 计算 所 和 曙光 公司 研制 星云 超级 计算 机 ，Linpack 峰值 1.271 
PFlops4， 在 TOP500 排名 第 2。 

过 @ 中 科 院 过 程 所 研制 了 Mole-8.5 系统 , Linpack 峰值 207.3TFlops, TOP500 排名 第 19。 


2.2 高 性 能 计算 应 用 的 早期 阶段 


3 1980 年 以 前 高 性 能 计算 应 用 与 具体 机 器 是 紧密 联系 的 ， 如 1959 年 研制 成 功 的 104 机 用 
.二 于 原子 弹 的 研制 ，1964 年 研制 成 功 的 119 机 用 于 氢弹 的 研制 ，1967 年 研制 成 功 的 109 丙 机 
~ 用 于 两 弹 一 星 研制 中 的 计算 。1980 年 出 现 了 向 量 机 ， 高 性 能 计算 应 用 的 主流 变 为 基于 向 量 
型 并 行 计算 的 通用 科学 计算 ， 如 线性 规划 、 伟 里 叶 变换 、 滤 波 计 算 以 及 矩阵 、 线 性 代数 、 偏 
= 微分 方程 、 积 分 等 问题 的 求解 。 


1995 年 随 着 并 行 处 理 系统 的 出 现 ， 高 性 能 计算 应 用 变 为 了 并 行 计算 ， 并 且 逐 渐 普及 到 
工程 计算 、 网 络 应 用 领域 ， 同 时 各 种 商业 应 用 软件 产品 大 量 出 现 。2005 年 中 国 自己 开发 的 
商业 应 用 软件 包 开 始 出 现 , 随 着 机 群 结构 的 高 性 能 计算 机 的 普及 , 已 经 有 超过 300 所 大 学 拥 
有 了 高 性 能 计算 机 ， 使 得 高 性 能 计算 应 用 在 中 国 逐渐 普及 。 


2.2.1 国家 高 性 能 计算 中 心 


1990 年 代 中 国 的 高 性 能 计算 只 局 限 在 石油 、 气 象 等 个 别 应 用 领域 ， 国 家 科技 部 为 了 推 
广 国产 的 高 性 能 计算 机 和 在 更 多 的 领域 推进 高 性 能 计算 应 用 ， 于 1995 年 成 立 了 第 一 个 国家 
高 性 能 计算 中 心 ， 其 主要 作用 有 : 


@ 促进 国产 曙光 系列 并 行 计 算 机 的 应 用 
@ 辅助 科学 、 工 程 和 环境 科学 中 大 规模 研发 项 目 ; 


”Symmetric Multi-Processing， 对 称 多 处 理 架 构 
”10” 浮 点 运算 (万 亿 次 ) 
“10” 浮 点 运算 〈 千 万 亿 次 ) 
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@ 为 并 行 计算 的 教育 提供 环境 。 


随后 相继 建立 了 北京 中 心 、 合 肥 中 心 、 成 都 中 心 、 武 汉中 心 、 上 海中 心 、 杭 州 中 心 、 了 
安 中心 、 北 京华 大 基因 中 心 等 多 个 国家 高 性 能 计算 中 心 , 它们 都 配置 了 国产 的 高 性 能 计算 机 
系统 。 这 些 高 性 能 计算 中 心 是 后 来 的 超级 计算 中 心 的 早期 形态 。 国 家 科技 部 还 设立 了 国家 高 
性 能 计算 基金 来 支持 这 些 中 心 的 发 展 。 基 金 于 1995 至 2000 年 共 资助 了 近 340 个 课题 , 加 上 
各 个 中 心 自 己 的 经 费 支 持 的 课题 , 到 2001 年 11 月 有 450 个 课题 使 用 各 个 国家 高 性 能 计算 中 
心 的 机 器 。 应 用 领域 包括 物理 、 化 学 、 石 油 、 核 能 、 和 气象、 航空 、 航 天 、 水 利 、 生 物 医 学 等 。 


通过 给 学 术 界 、 商 业 用 户 和 政府 提供 高 性 能 计算 硬件 、 软 件 、 通 信和 和 服务 支持 ， 这 些 国 
家 高 性 能 计算 中 心 在 早期 的 应 用 开发 中 发 挥 了 重要 作用 。 同时 , 也 积累 了 建设 高 性 能 计算 中 
心 的 丰富 经 验 , 其 中 一 些 中 心 成 为 国家 网 格 的 重要 组 成 部 分 。 这些 支 持 与 美国 国家 科学 基金 
会 (NSF) 从 20 世纪 80 年 代 到 90 年 代 对 超级 计算 机 研制 支持 很 类 似 。 


2.2.2 早期 应 用 开发 研究 的 典型 代表 


高 性 能 计算 的 发 展 带动 了 一 大 批 学 科 的 进步 , 许多 科研 人 员 借 助 高 性 能 计算 取得 了 丰硕 
的 科研 成 果 。 以 下 是 借助 高 性 能 计算 在 自身 领域 取得 卓越 的 成 绩 ,， 并 在 早期 起 到 了 示范 作用 


的 三 个 案例 。 


@ 陈 国 良 院 士 运用 高 性 能 计算 进行 防 灾 减 灾 研 究 : 陈 国 良 ,计算 机 科学 家 ，2003 年 当 
选中 国 工 程 院 院 士 。 他 于 90 年 代 中 期 开展 了 高 性 能 计算 及 其 应 用 的 研究 ， 率 先 发 
起 成 立 了 中 国 第 一 个 国家 高 性 能 计算 中 心 ， 开 发 了 基于 曙光 高 性 能 计算 机 的 “用 户 
开发 环境 ”软件 包 ; 通过 承担 国家 863 重大 项 目 “安徽 省 防 灾 减 灾 智能 信息 与 决 
策 支 持 系 统 ” 和 “淮河 流域 防洪 防 污 智能 调度 系统 ” 在 安徽 省 灾害 性 天 气 预报 ， 
汛期 淮河 流域 群 库 优化 调度 ， 以 及 淮河 防 污 治 污 中 发 挥 了 重要 作用 。 
@ 于 易 盛 院士 运用 高 性 能 计算 研究 晶体 光学 性 质 : 王 易 盛 ， 物 理学 家 ，2005 年 当选 中 
国 科 学 院 院士 。 他 的 主要 科研 工作 包括 以 下 四 个 方面 : 磁性 材料 ， 尤 其 是 磁性 体 表 
面 和 界面 性 质 的 理论 ; 表面 吸附 和 表面 电子 性 质 理论 ; 非 线性 光学 晶体 物理 性 质 的 
理论 计算 ; 固体 电子 结构 与 磁性 的 理论 计算 方法 。 他 在 非 线 性 光学 晶体 物理 性 质 的 
理论 计算 方面 ， 利 用 曙光 高 性 能 计算 机 求解 了 高 阶 复杂 问题 ， 并 将 理论 计算 成 果 应 
-和 用 于 各 种 实际 分 析 ， 取 得 了 很 好 的 成 果 。 
@ 陈 润 生 院 士 运 用 高 性 能 计算 进行 非 编 码 RNA 研究 ; 陈 润 生 ， 生 物 学 家 ，2007 年 当 
选中 国 科 学 院 院 士 。 他 在 基因 组 信息 学 领域 ， 完 成 了 中 国 第 一 个 完整 基因 组 果 生 热 
袍 菌 基因 组 的 全 部 生物 信息 分 析 ， 参 加 了 人 类 基因 组 和 水 稳 基 因 组 的 信息 分 析 ; 在 
非 编 码 基因 和 领域， 发 现 了 百 余 个 新 的 非 编 码 基因 ， 确 定 了 两 个 非 编 码 基 因 家 族 ， 发 
现 了 三 个 特异 的 非 编码 基因 启动 子 。 自 1993 年 以 来 ， 他 利用 高 性 能 计算 进行 非 编 
人 码 RNA 研究 ， 取 得 了 丰硕 的 成 果 。 


3 ”政府 行为 


3.1 主要 的 政府 计划 


中 国 的 高 性 能 计算 机 产业 是 在 863 计划 的 支持 下 发 展 起 来 的 。 从 1992 年 起 863 计划 先 
后 支持 了 电光 一 号 、 上 曙光 1000、 曙 光 2000、 曙 光 3000、 上 曙光 4000A、 深 腾 6800 的 研制 。 
十 一 五 期 间 (2005-2010 年 )863 计划 设立 了 “高 效能 计算 机 及 网 格 服务 环境 ”重大 专项 和 “高 
端 容错 计算 机 ”专项 。2006 年 国务 院 发 布 了 《国家 中 长 期 科学 与 技术 发 展 规划 纲要 (2006 年 
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-2020 年 )》， 设 立 了 16 个 科技 重大 专项 。“ 核 心 电 子 器 件 、 高 端 通用 芯片 及 基础 软件 产品 ?” 
专项 (简称 “ 核 高 基 ”) 是 16 个 科技 重大 专项 之 一 ， 与 高 性 能 计算 密切 相关 。 


3.1.1 高 效能 计算 机 项 目 


中 科 院 “十 一 五 信息 化 建设 专项 的 目标 是 研制 两 台 百 万 亿 次 计算 机 和 两 台 千 万 亿 次 计 
算 机 ， 开 发 网 格 软件 和 网 格 应 用 ， 建 设 服务 全 国 的 中 国 国家 网 格 (CNGrid)。 


中 科 院 计算 所 为 上 海 超级 计算 中 心 、 联 想 公 司 为 中 科 院 网 络 中 心 各 自分 别 研制 了 一 台 百 
万 亿 次 高 性 能 计算 机 ， 现 在 这 两 套 系统 都 已 交付 使 用 。 计 算 所 研制 的 曙光 5000 系统 又 称 为 
“魔方 ”(Magic Cube)， 峰 值 运算 速度 为 233 Tflops，Linpack 实测 值 达到 180.6Tflops， 在 
2008 年 11 月 份 公布 的 全 球 高 性 能 计算 机 TOP500 排行 榜 中 名 列 第 十 。 它 是 当时 中 国 性 能 最 
高 的 通用 计算 机 系统 ， 也 是 当时 除 美国 之 外 世界 范围 内 性 能 最 高 的 超级 计算 机 系统 ，2009 
年 6 月 份 正式 投入 运行 。 联 想 研 发 的 深 腾 7000 百 万 亿 次 系统 ， 实 际 Linpack 性 能 突破 每 秒 
106.5 Tflops, 并 在 国内 第 一 个 实现 了 PB 级 别 的 在 线 、 近 线 、 离线 的 三 级 结构 海量 存储 系统 ， 
2009 年 4 月 开始 正式 投入 运行 。 


> 863 计划 高 效能 计算 机 专项 于 2009 年 启动 了 2 台 千 万 亿 次 系统 的 研制 。 两 台 千 万 亿 次 
系统 的 用 户 分 别 是 深圳 市 超级 计算 中 心 和 天 津 市 滨海 新 区 超级 计算 中 心 。 两 台 千 万 亿 次 高 性 
能 计算 机 的 研制 者 分 别 为 中 科 院 计算 所 和 国防 科技 大 学 。 


科 院 计算 所 研制 的 千 万 亿 次 系统 称 为 曙光 6000， 是 一 台 由 计算 分 区 和 服务 分 区 组 成 
的 异 构 系 统 。 计 算 分 区 采用 计算 所 提出 的 超 并 行 (HPP, Hyper Parallel Processing) 体系 结构 ， 
是 一 种 改进 型 的 星 群 结构 。 服务 分 区 是 一 种 典型 的 基于 Intel 处 理 器 和 GPU 加 速 卡 的 刀片 服 
务 器 。 

曙光 6000 将 使 用 国产 高 性 能 龙芯 处 理 器 ， 超 节点 由 龙芯 3B 和 AMD Opetron 处 理 器 构 
成 ， 每 种 处 理 器 所 发 挥 的 作用 也 有 差异 。 多 数 应 用 软件 是 基于 x86 指令 集 , 但 龙芯 的 指令 集 
和 x86 指令 集 不 一 样 。 为 了 解决 兼容 性 问题 ， 超 节点 中 x86 处 理 器 运行 操作 系统 ， 编 译 和 应 
用 任务 先 提交 给 x86 处 理 器 , 再 由 硬件 支持 的 二 进 制 翻译 将 计算 任务 分 配 到 龙芯 处 理 器 上 运 
行 。 这 样 ， 应 用 程序 不 需要 修改 就 能 够 在 曙光 6000 上 运行 。 


> 龙芯 3B 是 8 核 CMP 结构 ， 每 个 核 带 有 SIMD* 加 速 部 件 ， 其 功 耗 远 低 于 主流 的 x86 处 
~ 理 器 ， 具 有 非常 高 的 性 能 功 耗 比 。 龙 芯 3B 的 设计 目标 是 主 频 1GHz， 浮 点 峰值 运算 速度 
128Gflops。 计 算 分 区 由 320 个 1U 尺寸 的 超 节 点 组 成 ， 每 个 节点 包含 8 个 龙 必 3B 处 理 器 。 
超 节 点 内 以 超 并 行 系统 控制 器 实现 处 理 器 间 的 高 速 互 连 ， 超 节点 间 采 用 高 速 商 用 网 络 
Infiniband 互 连 。 


曙光 星云 作为 曙光 6000 的 服务 分 区 于 2010 年 6 月 份 研制 成 功 , 在 当时 TOP500 中 排名 
第 二 。 星 云 系统 的 主要 参数 为 : 


理论 浮 点 峰值 性 能 ，2.98PFlops; Linpack 性 能 : 1.271PFlops; 

9280 个 6 核 2.66GHz Xeon 处 理 器 ， 共 55680 个 核 ; 

每 个 刀片 配置 一 个 GPGPU 加 速 卡 ， 共 4640 个 Nvidia Tesla C2050 GPGPU; 
4640 个 两 路 明光 TC3600 刀片 ，464 个 刀片 箱 ， 共 116 个 机 柜 ; 

系统 内 存 : 111.36TB DDR3; 

所 有 的 计算 节点 通过 三 层 Infiniband 4x QDR 网 络 互 连 ; 


5 Single Instruction Multiple Data， 单 指令 多 数据 流 


入 9 卷 纯 


曙光 TC3600 刀片 系统 遵循 SSI (Server System Infrastructure ) 标准 
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整 系统 功 耗 : 3MW; 
运行 Linux 操作 系统 和 曙光 机 群 系统 管理 


\ 记 


软件 。 


Letter 


和 


准 
化 技术 。 


划分 CPU 和 GPU 上 和 
(还 包括 OpenCL 兼容 ) 三 级 并 行 。 为 了 玫 
权衡 、 片 内 共享 存储 中 的 数据 如 


单 节 点 的 


员 会 


制定 的 标准 ，MPHE 延 迟 是 1.5ps， 点 到 点 


信和 带宽 是 3.2GB/s 


地 


星云 异 构 系 统 需要 CPU-GPU 混合 
FE 务 。 由 本 


民 


月 


Linpack 效率 可 达到 69.89%。 


日 等 针对 Fermi 体系 结 


有 程 获 得 更 好 的 性 能 ， 通 过 自 适 应 负载 
整个 系统 并 行 度 可 达 上 千 万 级 , 需要 MPI、OpenMP 逢 
得 更 高 浮 点 效率 ， 比 如 在 线程 数量 和 有 FP 
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， 支 持 GPU-Direct 优 


F 衡 策略 
1 CUDA 
民 资 源 的 


构 优 化 相 汉 习 


国防 科大 研制 的 千 万 亿 次 系统 称 为 天 河 (Tianhe ) 系列 。 天 河 -1 的 到 


系列 的 优化 ， 


! 论 峰值 是 


1206TFlops，Linpack 峰值 是 563.1TFlops，Linpack 效率 为 600%。 天 河 -1 是 由 Intel Xeon 4 核 


和 AMD 


575MHz HD4870X2 组 成 的 异 构 系 统 ， 


512 个 IO 节点 配置 为 两 路 Intel Xeon 多 


核 处 理 器 .所 有 节点 通过 40Gbps Infiniband 网 络 互 连 , 内 存 总 容量 为 98TB, 存储 容量 为 1PB。 
整个 系统 包括 100 机 柜 ， 功 耗 为 1.8MW。2010 年 10 


功 ， 其 系 


面向 


~ 结构 ，Linpack 峰值 


统 结构 和 星 


云 类 似 ， 采 月 


行 应 用 软 伯 


© 境 、 航 所 


10 年 来 863 计划 在 高 性 能 计算 应 
3.1.2 高 端 容错 计算 机 项 目 


该 项 目 


算 机 产品 
机 的 可 用 
E 


| 


、 新 能 源 、 工 业 仿真 优化 、4 


E 物 制药 等 。 
j 软 件 


个 项 


的 首次 投资 。 


日 研究 项目 
日 、 千 万 亿 次 高 效能 计算 机 的 算法 库 、 面 
系统 ， 候 选 领域 包括 气候 、 核 能 、 石 ; 


 ， 天 河 -1 的 升级 版 本 天 河 -1A 研制 成 
日 ntel Xeon 多 核 处 理 器 和 Nvidia GPGPU 组 成 的 异 构 体系 
达到 2.5PFlops， 为 当前 世界 最 快 的 超级 计算 机 。 


2009 年 863 计划 启动 了 面向 千 万 亿 次 高 性 能 计算 机 的 高 性 能 计算 应 月 
判 造 业 和 资源 环境 领域 的 高 性 能 计算 与 网 格 应 有 
向 于 万 亿 次 高 效能 计算 机 的 大 规模 3 


， 包 


Wd 


括 : 


|、 环 


目 资 助 400 万 元 。 这 次 立项 是 近 


目标 是 针对 金融 、 电 信 等 领域 的 关键 应 用 (critical application)， 研 制 高 端 容错 计 
， 以 打破 国外 产品 在 这 些 领域 的 垄断 ， 降 低 中 国 的 信息 化 建设 成 本 。 高 端 容错 计算 
度 要 达到 99.999%， 兼 容 主 流 高 端 数据 库 和 中 间 件 ， 并 在 至 少 两 个 关键 领域 的 生产 


业务 系统 上 实现 规模 化 应 用 。 第 一 阶段 到 2010 年 12 月 ， 研 制 32 处 理 器 的 高 端 容错 计算 


机 ，863 计划 支持 经 费 5.9 亿 元 ， 要 求 主 机 研制 企业 配套 9.75 亿 元。 第 二 阶段 到 2012 年 12 
月 ， 研 制 64 处 理 器 的 高 端 容错 计算 机 ， 系 统 TPC-C 值 要 达到 2007 年 底 的 国际 领先 水 平 。 

第 一 阶段 共 安排 了 4 个 课题 ， 包 括 : 高 端 容错 计算 机 总 体 研 究 ，3000 万 元 ; 高 端 容错 
计算 机 评估 与 测量 ，4000 万 元 ; 两 个 高 端 容错 计算 机 主机 研制 ， 共 5 亿 2000 万 元 。 主 机 课 
题 的 研究 内 容 包括 : 主机 研制 和 其 在 银行 或 电信 和 领域 关键 业务 的 示范 应 用 , 主要 的 指标 如 下 : 

@ 32 路 处 理 器 ， 紧 耦合 共享 存储 结构 ; 

@ 研制 具有 自主 知识 产权 的 芯片 组 ; 

@ 系统 平均 可 用 度 达 到 99.999%， 年 停机 时 间 <5.26 分 钟 ; 

@ 系统 峰值 定点 计算 能 力 大 于 800GIPS”， 浮 点 计算 能 力 大 于 800GFlops; 

@ 系统 全 局 共享 存储 器 容量 大 于 2TB， 系 统 存储 器 总 带宽 大 于 800GB/s; 

@ 系统 内 部 互连网 络 总 带宽 大 于 960GB/s; 

@ IO 子 系统 规模 大 于 128 条 PCI-E 通道 ; 

@ 具有 芯片 级 在 线 故 障 定位 与 诊断 能 力 ， 部 件 级 模块 具有 热 插 拔 快速 修复 能 


8 Message Passing Interface 


”Instructio 


ns per second 


中 国 高 性 能 计算 研究 与 应 用 调查 报告 


具有 操作 系统 核心 级 故障 检测 、 故 障 隔 离 、 故 障 恢复 的 功能 ; 
文 持 操作 系统 核心 进程 的 多 副本 备份 与 恢复 ; 

支持 系统 级 进程 检查 点 技术 ; 

虚拟 机 监控 器 的 性 能 开销 不 大 于 10%; 


闻 件 能 扩展 到 32 路 紧 耦 合 处 理 器 ; 


至 少 兼 容 一 种 商品 化 数据 库 、 一 种 中 间 件 及 一 种 存储 管理 与 备份 软件 ; 数据 库 、 中 


操作 系统 支持 LSB 和 POSIX 标准 ， 支 持 符合 工业 标准 的 系统 状态 监控 ; 


@ 实现 与 IJBM p 系列 或 HP Sperdome 系列 的 互 备 运行 ， 切 换 时 间 不 高 于 60 秒 。 
华为 公司 和 浪潮 公司 各 自 获 得 经 费 2.6 亿 元 的 项 目 资助 ， 要 求 到 2010 年 底 完成 32 路 处 


理 器 高 端 容 错 计算 机 的 研制 。 华 为 公司 的 技术 路 线 是 采用 Sun Sparc 处 理 器 和 Open Solaris 


操作 系统 。 虽然 SUN 公司 已 被 甲骨 文 (Oracle) 公司 收购 ， 但 Sparc 处 理 器 已 


完全 由 富士 通 


(Fujisu) 生产 ， 且 Open Solaris 是 开源 操作 系统 ， 因 此 该 项 收购 不 会 对 华为 公司 的 方案 产 
生 影 响 。 浪 潮 公 司 的 技术 路 线 是 采用 Intel X86 QPI 和 Windows/Linux 操作 系统 ， 已 经 得 到 


英特尔 公司 的 QPI 授权 。 


该 项 目的 巨大 挑战 除了 开发 高 端的 蕊 片 组 和 交换 芯片 、 购 买 昂贵 的 QPI PHY 以 外 ， 系 
统 软件 和 行业 应 用 的 移植 和 认证 工作 量 将 更 为 巨大 。 它 挑战 的 竞争 对 手 是 IBMP 系列 和 HP 


Superdome 系列 ， 以 及 这 些 国 际 企业 的 服务 能 力 。 
3.1.3 核心 电子 器 件 、 高 端 通用 芯片 及 基础 软件 产品 专项 


2006 年 1 月 , 国务 院 发 布 了 《国家 中 长 期 科学 与 技术 发 展 规划 纲要 (2006 
设立 了 16 个 科技 重大 专项 。“ 核 心 电 子 器 件 、 高 端 通用 芯片 及 基础 软件 产品 ” 


年 -2020 年 )》， 


"(简称 “ 核 高 


基 ”) 是 其 中 之 一 。2008 年 ， 专 项 发 布 了 《2009-2010 年 课题 申报 指南 》 其 


能 计算 密切 相关 。 至 今 ， 申 请 其 中 “高 性 能 多 核 CPU” 项 目的 单位 包括 中 科 院 计算 所 、 国 


防 科大 和 江南 计算 所 。 三 项 的 技术 指标 如 下 : 


1. 高 性 能 多 核 CPU: 

@ 采用 65nm 或 者 更 先进 工艺 ; 
@ 

@ 


片 内 集成 4 个 以 上 64 位 高 性 能 处 理 器 核 ; 
主 频 1.5GHZ 以 上 ; 
@ 用 于 国产 千 万 亿 次 高 性 能 计算 机 系统 ; 
2. 支持 国产 CPU 的 编译 系统 及 工具 链 : 
文 持 主 要 的 国产 CPU; 
支持 C、C++、Fortran、Java、OpenMP 等 程序 设计 语言 ; 
文 持 面 向 多 核 体 系 结构 的 自动 并 行 化 ; 
文 持 低 功 耗 编译 优化 ; 
文 持 国际 主流 CPU 指令 到 国产 CPU 指令 的 二 进 制 翻译 。 
有 程序 调试 和 性 能 分 析 等 工具 ; 
编译 性 能 与 商用 编译 器 相当 ; 
@ 支持 国际 主流 CPU 及 国产 CPU， 支 持 多 核 ; 
@ 支持 SMP、ccNUMA、 机 群 等 多 种 计算 机 体系 结构 ; 
@ 文 持 国 际 和 国内 服务 器 操作 系统 相关 标准 或 规范 ; 


3 Intel QuickPath Interconnect， 快 速 通道 互 连 


有 三 项 与 高 性 
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@ 文 持 国内 TCM 等 可 信 计 算 相关 规范 ， 并 达到 “GB/T 20272 操作 系统 安全 技术 
要 求 ” 的 第 四 级 安全 等 级 ; 
@ 支持 软 硬 件 协同 虚拟 化 、 动 态 升降 级 等 可 用 性 要 求 ; 
@ 支持 网 络 化 部 署 、 远 程 管理 与 监控 等 可 管理 性 要 求 ; 
@ 与 国际 主流 Linux 服务 器 操作 系统 功能 、 性 能 相当 ; 
@ 支持 丰富 的 应 用 软件 ; 
3.2 超级 计算 中 心 


目前 ， 中 国有 两 个 超级 计算 中 心 配 有 超过 100TFlops 的 系统 ， 分 别 是 南方 的 上 海 超级 计 
算 中 心 (SSC) 和 北方 的 中 科 院 超级 计算 中 心 (SCCAS)。 最 近 ， 又 在 深圳 和 天 津 分 别 建立 
了 两 个 千 万 亿 次 超级 计算 中 心 ， 此 外 北京 、 广 州 、 山 东 、 成 都 、 福 建 和 沈阳 等 地 方 政府 也 在 
积极 筹备 超 算 中 心 。 


3.2.1 上 海 超级 计算 中 心 
上 海 市 超级 计算 中 心 (简称 上 海 超 算 ) 成 立 于 2000 年 12 月。 


上 海 超 算 按照 服务 功能 分 为 4 个 部 门 : (1) 科学 计算 、(2) 工程 计算 、(3) 研究 开发 、 
(4) 技术 支持 。 技 术 支持 部 门 负责 机 器 和 网 络 的 维护 和 管理 ， 研 究 开发 部 门 关注 网 格 和 并 
行 编程 ， 科学 与 工程 计算 部 门 负 责 应 用 。 主 要 的 工作 包括 用 户 支 持 、 软 件 移植 和 调 优 、 用 户 
培训 和 软件 开发 。 技 术 支 持 部 门 的 系统 管理 员 均 具有 计算 机 科学 方面 的 背景 ， 80% 的 网 格 计 
算 人 员 有 计算 机 科学 背景 ，20% 的 人 员 有 计算 科学 背景 。 其 他 部 门 约 40-45% 的 人 员 有 计算 
机 科学 背景 ，34-40% 有 计算 科学 背景 ，20-40% 有 应 用 背景 。 超 算 中 心 具备 了 技术 咨询 、 支 
持 和 服务 的 能 力 。 为 了 更 好 地 给 用 户 提供 服务 ， 上 海 超 算 与 当地 大 学 如 上 海 交 通 大 学 、 复 旦 
大 学 建立 了 密切 的 合作 ， 在 具体 应 用 开发 方面 开展 了 大 量 的 工作 。 


@ 资源 〈 硬 件 和 软件 ) 


表 1. 曙光 4000A 配置 一 览 


上 海 超 算 的 硬件 系统 至 今 已 经 更 
新 了 四 代 : 神威 -I (384GFlops)、 神 威 2Tflops 
新 世纪 -64P (307GFlops)、 曙光 4000A 计算 结 点 512 个 4 路 AMD Opteron 处 理 器 

( 10TFlops ) 和 曙光 5000A 仔 储 绽 挟 16 个 4 路 AMD Opteron 处 理 右 
(230TFlops)。 目前 神威 -I 和 神威 新 世 接 入 结 点 4 个 4 路 AMD Opteron 处 理 器 
纪 -64P 已 经 不 再 提供 计算 服务 (神威 “CPU AMD OPTERON 850, 2.4GH, 
新 世纪 -64P 的 技术 指标 见 附 表 A), 现 。。， A 
在 正在 运营 的 系统 曙光 4000A 和 曙光 “系统 闪存 总 容量 4256GB 
5000A 的 配置 参数 见 表 1 和 表 2。 值 得 ”磁盘 总 容量 201B 
一 提 的 是 ， 上 曙光 5000A 在 研制 测试 时 作 系 加 架构 Cluster、 Myrinet 2000 
安装 的 是 微软 的 Windows 机 群 操作 系 -操作 系统 


统 ，Linpack 测试 性 能 排名 世界 第 10。{1 
现在 安装 在 上 海 超 算 的 系统 已 经 全 部 替换 成 Linux 系统 。 ee 


旦 是 ， 由 于 上 海 超 算 99% 的 用 户 要 求 用 Linux 系统 ， 


告 , 瞩 光 5000A 
比如 机 柜 一 级 的 智能 控制 和 实时 


系统 运行 至 今 便 件 系统 非常 稳定 ， 上 只 是 水 冷 系 台 | 善 
响应 。 上 曙光 5000A 采用 的 多 核 系统 ， 其 单 核 的 性 能 比 晶 光 4000A 的 性 能 稍 弱 ， 因 此 ， 性 能 
的 提高 更 依赖 于 系统 软件 、 应 用 软件 的 优化 。 此 外 ， 文件 系统 在 未 来 也 需要 改善 。 和 其 他 超 


算 中 心 类 似 ， 上 海 超 算 也 提供 了 一 些 主流 高 性 能 计算 商业 软件 的 使 用 ， 包 括 NASTRAN， 


FLUENT, PAMCRASH, LS-DYNA, MARC, ANSYS-Multiphysics, FEKO, CFX, GAUSSION 


I 


03 等 。 此 外 , 还 安装 有 一 些 国内 软 从 


9 


开发 人 员 修 改 的 软件 如 NWChem, EGO, BLAST DOCK, 


中 


生 能 计算 和 


调查 报告 


究 与 应 


VASP, CPMD, WIEN 2000, SIESTA, ABINIT, NAMD, GROMACS, COSMOS, MM5, WRE, 


APRS 等 。 完 整 的 软件 列表 见 附 


表 2. 魔方 (曙光 5000A) 西 
系统 峰值 
计算 结 点 


操作 系统 


党 言 


数学 库 


到 俐 于 全 
作业 调度 系统 


管理 软件 


@ ”应 用 和 用 户 


气候 和 气象 
计算 化 学 


计算 流体 


有 限 元 分 析 


Gs 


磁场 分 析 
多 物理 分 析 
系统 仿真 、 规 


数据 处 理 方面 
高 能 物理 试验 


超 算 的 主要 应 上 


表 B 附 表 CC。 


TA 


已 置 
230Tflops 


项 


刀片 : 每 个 刀片 节点 配置 4 颗 AMD 8347HE 64 位 低 功 耗 CPU; 


胖 节点 :采用 8CPU 的 SMP 结构 , 配 
配置 SKVM 扩展 系统 ， 本 
Infiniband 网 卡 


a 


8 颗 AMD 8347HE CPU; 
CL 置 PCIE 8X 双 端 口 ConnectX DDR 


32 个 普通 接 入 节点 ，8 个 图 形 接 入 节点 ， 每 个 节点 2 个 CPU 


AMD 8347HE 
95TB 


64 位 低 功 耗 1.9GHz CPU 


500 TB SAN 存储 

Infiniband ConnectX DDR 
Suse Linux Enterprise Server10 
C, C++, Fortran 77, Fortran90 
NAG ACML 1.5, ATLAS 3.6 


Lustre 
LSF7.0 


曙光 机 群 管理 系统 DCOS 


划 
的 应 用 有 : 
数据 处 理 


天 文 观 测 数据 


处 理 


知识 检索 和 挖 
遥感 数据 处 理 
企业 数据 中 心 
业务 系统 备份 
数据 容 灾 备份 
商业 智能 


全 有 


据 


涵盖 了 科学 与 工程 计算 、 数 据 处 理 等 领 


10 


域 , 科学 与 工程 


计算 方面 的 
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一 ”远程 教育 
如 表 3、4、5 的 统计 数据 所 示 ， 上 海 超级 计 


增 用 户 62 个 ， 其 1! 


表 3. 各 用 户 机 构 机 时 统计 


科学 用 户 42 个 ， 工 程 用 户 20 个 。 用 广 


表 4. 各 领域 
项 目 领 域 


高 校 5 983 947.66 
工程 设计 院 73 687.73 
工业 企业 235 556.40 
基础 研究 所 8 549 336.41 
内 部 632 851.48 
上 用 户 通 过 网 络 连 接 使 用 资源 。2008 年 新 
增 应 用 领域 4 个 ， 包括 桥梁 工程 、 测 绘 、 农 
业 、 生 物 医学 等 。 这 些 统计 数据 表明 : 用 户 
主要 来 自 上 海 周 边 和 北京 的 高 校 与 科研 院 


所 ; 工业 应 用 的 机 时 占用 比例 不 足 20%; 应 
用 项 目 多 来 自 国家 的 各 类 科技 计划 ; 超过 
90% 的 用 户 的 应 用 使 用 的 CPU 数 小 于 64 
个 ; 材料 和 物理 领域 占据 了 最 多 的 机 时 。 


为 了 更 大 程度 利用 曙光 5000A 的 计算 


| 
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算 : 


心 的 用 


材料 
机 械 工 程 
物理 
航空 航天 
化 学 
汽车 
软件 测试 
生物 制药 
获 区 
土木 工程 
纳米 研究 
其 他 


户 累计 达到 356 个 ，2008 年 新 
! 来 自 全 国 27 个 省 市 地 区 ，95% 以 
项 目 数 统计 
项 目 数 机 时 总 数 (CPU#* 小 时 ) 
30 5 499 977 
19 147 546 
6 3 613 145 
10 380 453 
16 1 133 673 
17 111 521 
8 102 025 
14 1 493 714 
8 2 069 520 
214 192 
8 614 687 
24 104 274 


表 5. 各 CPU 使 用 段 的 用 户 数 比例 统计 


能 力 ， 上 海 超 算出 资 100 万 元 鼓励 用 户 使 用 a ii de 
大 规模 的 并 行 节点 。 例 如 ， 某 用 户 原来 的 程 bh = 
序 使 用 了 128-256 个 CPU, 如 果 现 在 成 功 使 me 13.26 
用 256-512CPU， 该 用 户 将 获得 资助 。 但 上 eR ee 
海 超 算 的 管理 人 员 分 析 称 很 少 有 用 户 单位 ea ee 
L 备 这 样 的 能 力 改 善 并 行 软件 。 一 个 篮 众 的 33-64 个 cpu 11.78 
事实 是 ， 目 前 超 算 中 心 很 少 有 石油 领域 的 用 Ea wd 
户 ,因为 这 类 用 户 有 奴 厚 的 资金 自己 购买 大 一 8 个 cpu 忆 上 上 Le 
型 机 器 

上 海 超 算 的 长 远 目标 是 发 展 成 为 盈利 的 服务 型 单位 ， 目 前 距 这 一 目标 还 有 一 定 距离 。 事 


上 ， 超 算 中 心 对 学 术 界 和 工业 界 用 户 采 取 不 同 的 收费 标准 。 


3.2.2 中 科 院 超级 计算 中 心 


十 一 五 期 间 ， 中 国 科 学 院 就 计划 建设 | 


年 间 , 科学 院 的 各 个 
间 是 一 种 松 \ 散 的 关系 ， 中 下 
避免 到 大 型 超 算 中 心 的 大 量 数 


科 院 超级 计算 中 ， 


一 个 大 型 超 算 中 心 和 10 个 中 型 超 算 中 心 及 大 型 
科学 数据 库 《〈 如 中 国 西南 动物 植物 资源 数据 库 ) 组 成 的 e-Science 超 算 环 境 。 在 2008-2010 


心 的 前 身 是 1996 年 成 立 的 


究 所 对 5-10Tflops 量 级 系统 的 需求 十 分 
型 超 算 中 心 主要 满足 所 在 区 域 的 研究 所 的 ， 


> 普遍。 大 型 与 中 型 超 算 中 心 之 
小 规模 的 计算 需求 ， 以 


心 实验 室 ，1997 正式 更 名 为 超级 计算 ， 
支持 部 ; (2) 系统 管理 和 维护 部 ; (3) 
融 虚拟 实验 室 ， (6) 中 国 国 家 网 格 管理 
发 文 持 ， 


心 。 


外 心 ; 


(7) 公共 事务 
如 可 视 化 、 并 行 算 法 设计 、 网 格 计算 技术 。 此 外 ， 该 中 心 还 


目前 有 34 个 员工 ， 由 
客户 服务 


据 的 移动 。 这 些 中 心 在 2009 年 内 都 已 建设 完成 。 
FP 科 院 超级 计算 应 用 与 计算 机 网 络 信 息 


中 


7 个 部 门 组 成 : (1) 技术 


部 ，(4) 计算 化 学 虚拟 实验 室 ; (5) 计算 金 


部 。 超 过 20 个 员工 从 事 应 用 


不 有 博士 和 在 读 的 研究 生 


中 国 高 性 能 计算 研究 与 应 用 调查 报告 


约 20 名 。 
@ 资源 〈 硬 件 和 软件 ) 


中 科 院 超 算 中 心 的 计算 机 经 历 了 从 几 十 亿 次 的 SGI 系统 (1996 年 )、 近 百 亿 次 的 日 立 系 
统 〈1998 年 )、 于 亿 次 的 曙光 2000 I (2000 年 )，5 万 亿 次 的 联想 深 腾 6800 (2003 年 )、 用 
于 可 视 化 的 SGI Onyx 350 (2004) 到 目前 2.8TFlops 的 IBM celybroadband 机 群 (2007)、 百 
万 亿 次 的 联想 深 腾 7000 (2008 年 ) 的 持续 演变 。 目 前 ，SGI Onyx、 曙 光 2000-II 和 深 腾 6800 
己 经 不 再 提供 计算 服务 。 


超 算 中 心 的 主力 计算 服务 平台 是 联想 深 腾 7000， 理 论 峰 值 120TFlops，Linpack 峰值 
106.5TFlops，2008 年 TOP500 排名 第 19 位 。 该 系统 配置 为 : 


一 1140 个 计算 刀片 , 每 个 刀片 由 2 路 Intel 3GHz 的 4 核 Xeon 处 理 器 和 32GB 内 存 组 
成 ， 用 于 计算 密集 型 应 用 
一 38 个 厚 节点 ， 每 个 节点 是 16 路 Intel 4 核 Xeon 处 理 器 和 512GB 内 存 ， 用 于 访 存 
密集 型 和 数据 库 应 用 
一 ”2 个 胖 节 点 ，SGI Alitx4700 NUMA 系统 ， 每 个 节点 由 192 个 Intel 1.67GHz 安 腾 2 
让 双核 处 理 器 和 2.5TB 内 存 组 成 ， 用 于 满足 对 内 存 需 求 大 的 应 用 
> 一 可视化 节点 ，12 个 双 路 Intel 3GHz 四 核 处 理 器 、32GB 内 存 和 NV8800GTS 显卡 
一 。 20Gbps 4X DDR Infiniband 互 连 
一 350TB 磁盘 ，1PB 磁带 
一 65 个 机 柜 ， 占 地 面积 240 平方 米 
过 - ” 整 系 统 功 耗 1.9MW 
一 ”配置 有 系统 管理 软件 、 并 行 开发 环境 和 应 用 软件 


软件 资源 包括 一 些 商 业 软 件 、 大 量 的 开源 软件 以 及 超 算 和 用 于 独立 开发 的 软件 ,如 由 超 
算 中 心 独立 开发 完成 的 PSEPS 特征 值 问题 并 行 求解 软件 和 PMDFFT 并 行 多 维 传 里 叶 软 件 


< 包 。 

- e@ ”应 用 和 用 户 

= 依托 中 国 科 技 网 ,中 科 院 超 算 中 心 累计 为 三 百 余 用 户 提供 了 计算 服务 , 提供 计算 机 时 傅 
三 千 万 CPU 小 时 ,为 国家 973、863 计划 和 国家 自然 基金 等 重大 项 目 提供 了 高 质量 的 计算 服 
务 。 中 科 院 超 算 中 心 的 运营 模式 是 完全 由 科学 院 财政 支持 ,用户 免费 使 用 ， 是 科学 院 信息 化 
的 组 成 部 分 。 


根据 统计 ， 深 腾 7000 的 系统 利用 率 已 经 从 2009 年 4 月 安装 初期 的 3.11% 提 升 到 2009 
年 6 月 份 的 36.62%。2009 年 6 月 到 7 月 间 ， 有 165 个 用 户 ， 其 中 42 个 是 超 算 内 部 开发 人 
员 的 调试 、 软 件 安装 和 测试 ， 其 他 的 123 的 实际 用 户 中 ，111 个 来 自 中 科 院 的 各 研究 所 ， 消 
耗 了 4 百 万 机 时 。 用 户 计算 题 目 涉及 计算 物理 、 计 算 化 学 、 材 料 科 学 、 生 命 科 学 、 药 物 设计 、 
地 球 物理 、 流 体力 学 、 气 候 模拟 、 天 文学 、 农 业 和 计算 机 科学 等 领域 。 


目前 ， 最 大 运行 规模 的 应 用 为 天 文 星系 风 模 拟 计算 ， 利 用 了 联想 深 腾 7000 的 8192 个 
CPU 核 。 商 业 软 件 受 软件 许可 的 限制 ， 一 般 规模 都 不 大 。 用 户 自己 开发 的 并 行程 序 ， 规 模 
一 般 可 以 扩展 得 较 大 ， 如 1024 核 的 生物 蛋白 质 inspect 计算 应 用 、1024 核 的 空间 天 气 MHD 
计算 应 用 、 开 源 软件 Lammps 的 8192 核 计算 应 用 等 。 深 腾 7000 在 2009.6 至 2009.7 期 间 ， 
64 个 CPU 及 以 上 规模 的 作业 使 用 总 机 时 的 69%，2048-4096 个 CPU 规模 的 作业 使 用 总 机 
时 的 31%。 
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3.2.3 在 建 的 超 算 中 心 
上 海 超 算 中 心 和 中 科 院 超 算 中 心 是 百 亿 次 级 别 的 超级 计算 中 心 , 如 何 有 效 利用 其 计算 能 
力 仍然 是 一 个 严峻 的 挑战 性 问题 。 但 同时 ,天津 国家 超 算 中 心 和 深圳 南方 超 算 中 心 两 个 千 万 
亿 次 的 超级 计算 中 心 已 经 批准 建设 。 
e@ 天 津 国家 超 算 中 心 
天 津 超 算是 国家 科技 部 、 国 防 科大 和 天 津 市 政府 于 2009 年 联合 成 立 的 ， 运 行 国防 
科大 研制 的 天 河 千 万 亿 次 超级 计算 机 ,是 国家 网 格 的 一 个 主 节点 。 最 近世 界 上 排名 第 一 
的 超级 计算 机 天 河 -1A 已 经 投入 使 用 ， 该 系统 将 主要 用 于 石油 勘探 和 大 型 飞行 器 的 模 
拟 ， 此 外 还 包括 科学 发 现 、 金 融 分 析 、 汽 车 和 船舶 设计 。 
e@ ”深圳 南方 超 算 中 心 
深圳 超 算是 由 国家 科技 部 ,中 科 院 和 深圳 市 政府 联合 成 立 的 , 总 投资 约 8 亿 人 民 币 。 


中 科 院 计算 所 研制 的 昌 光 6000 将 于 2011 年 底 落户 深圳 超 算 ， 为 深圳 、 香 港 、 澳 门 、 台 
= 湾 和 南亚 地 区 提供 计算 服务 。 据 初步 估计 ， 来 自 深圳 地 区 的 计算 需求 约 800TFlops， 来 
Ee 自 港澳 台 和 南亚 地 区 的 约 300TFlops。 上 曙光 6000 上 的 应 用 可 能 非常 灵活 多 样 ， 除 了 伟 
CN 统 的 研究 和 教育 用 户 ， 深 圳 超 算 中 心 还 将 面向 更 实际 和 具体 的 应 用 ， 如 Big-Sciences 项 
GN 目 、 生 物 工程 、 动 漫 等 。 
已 目前 , 中 国 许多 地 方 政府 对 于 建立 超 算 中 心 都 比较 热心 。 多 个 地 方 政府 的 建设 计划 已 经 
CD 获得 批准 。 第 三 个 千 万 亿 次 的 超 算 中 心 也 在 酝酿 当中 ， 计 划 建 在 山东 省 ， 由 济南 计算 技术 研 
区 究 所 负责 具体 操作 。 成 都 市 、 北 京 市 2009 年 各 建立 了 一 个 20 万 亿 次 左右 的 超 算 中 心 ， 山 东 
和 一 省 、 广 州 市 、 沈 阳 市 等 都 有 计划 要 建设 地 方 的 超 算 中 心 。 地 方 政府 建立 超 算 中 心 的 目的 概括 
Co 起 来 主要 有 以 下 几 点 ; (1) 来 自 于 现实 的 应 用 需求 :2006 年 之 前 ， 对 高 性 能 计算 的 需求 多 来 
Ee 自 国家 尖端 应 用 ， 现 在 ， 经 济 发 达 地 区 区 域 经 济 的 发 展 不 断 推 高 高 等 教育 、 科 研 、 工 业 、 信 
息 服 务 等 领域 对 计算 能 力 的 需求 ，(2) 政 治 需求 ， 高 性 能 计算 的 水 平 是 衡量 一 个 国家 和 地 区 
综合 实力 和 竞争 力 的 重要 指标 , 地 方 超 算 中 心 的 建立 , 可 以 提升 地 方 在 国家 自主 创新 战略 中 


= 的 地 位 ;，(3) 作为 科技 创新 拉动 经 济 增长 的 一 个 重要 手段 ， 地方 政府 建立 超 算 中 心 ， 将 其 作 

一 为 科技 领域 中 的 地 方 标志 性 工程 ， 为 企业 提供 公共 的 科技 服务 ， 有 助 于 政府 招商 引资 , 吸引 

© 科技 人 才 ;， (4) 作 为 惠及 大 众 的 公共 信息 化 服务 平台 : 政府 将 家 庭 、 社 区 、 城 市 的 各 种 信息 
进行 融合 处 理 ， 大 大 提高 城市 管理 的 效率 ， 给 市 民 带 来 便利 。 


然而 ,一 个 严峻 的 事实 是 国内 在 千 万 亿 次 系统 的 有 效 使 用 支撑 方面 明显 滞后 ， 甚 至 天 津 
和 深圳 超 算 中 心 的 技术 人 员 ， 在 管理 和 使 用 这 样 大 规模 系统 方面 仍 存在 准备 明显 不 足 的 现 
象 ， 这 和 对 超级 计算 的 应 用 需求 和 所 需 技术 支撑 缺乏 足够 的 认识 和 必需 的 调研 有 一 定 的 关 
系 。 


地 方 超 算 中 心 建立 之 后 ， 将 打造 科技 服务 平台 、 产 业 创 新 平台 、 科 研 研 发 平台 和 人 才 聚 
攻 培 养 平台 ， 在 国家 科研 项 目 、 企 业 创新 、 城 市 管理 数字 化 、 文 撑 基 础 研究 等 方面 发 挥 重 要 
作用 。 地 方 政府 提供 运 维和 服务 经 费 文 持 ， 除 上 述 上 海 、 天 津 、 深 圳 中 心 外 ， 其 他 地 方 超 算 
中 心 的 建立 则 全 由 地 方 政府 出 资 。 绝 大 部 分 超 算 中 心 都 是 独立 的 政府 事业 法 人 , 包括 电费 在 
内 的 运 维 费用 、 人 员 费 用 ， 大 部 分 由 政府 出 资 支 持 。 除 了 面向 企业 提供 的 有 偿 服务 外 ， 超 算 
中 心 提供 的 科研 、 教 育 平台 和 公共 信息 服务 平台 都 是 免费 的 。 超 算 中 心 的 运营 需要 巨大 的 维 
护 开销 。 以 一 个 千 万 亿 次 的 超 算 中 心 为 例 ， 每 年 的 电费 就 需要 约 3000 万 元 ， 长 期 来 说 ， 对 
政府 是 一 个 很 大 的 负担 。 目 前 还 缺乏 有 效 的 激励 机 制 使 这 些 中 心 提 高 运营 效率 和 服务 水 平 。 


chinaXiv:201703.00227V1 
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所 以 , 成 都 超 算 中 心 探索 了 一 个 新 的 模式 ， 


与 应 用 调查 报告 


设 、 运 行 的 超 算 中 心 ， 政 府 和 企业 用 户 按 照 云 计算 的 商 


3.3 网 格 基础 设施 


1999 年 ~2000 年 ，863 计划 实施 了 国家 高 性 
中 心 构成 的 国家 高 性 能 计算 环境 ， 形 成 中 国 网 格 的 雏形 。 
究 得 到 了 政府 的 大 力 支持 。 主 要 的 网 格 项 目 包 括 : 


空间 信息 网 格 、 高 效能 计算 机 和 网 格 服务 环境 ; 


3.3.1 中 国 国家 网 格 


持 下 建设 的 。 一 
参加 。 在 网 格 环境 、 网 格 软件 和 网 格 应 用 等 


能 计算 环境 项 目 ， 


高 性 能 计算 机 制造 企业 出 资 成 立 一 个 由 企业 建 


业 模 式 ， 租 用 它 提供 的 服务 。 


中 国 国 家 网 格 CCNGrid) 是 在 863 计划 “高 性 能 计算 机 及 
期 建设 历时 4 年 (2002 年 ~2005 年 )， 国 内 有 23 
几 个 方面 ， 完 成 了 一 让 


设 周期 是 2006 年 至 2010 年 12 月 底 ， 重 点 在 于 


环境 。 


中 国 国家 网 格 装备 了 自主 研制 的 高 性 能 计算 机 ， 由 10 个 节点 构成 了 
其 中 北方 主 节点 为 中 科 院 计算 机 网 络 信 息 中 心 的 联想 深 腾 7000， 南 方 主 节点 为 上 海 超级 计 


进 


此 后 ， 基 而 
国家 863 计划 支持 的 中 国 
国家 教育 部 支持 的 中 
持 的 中 国 科 学 网 格 。 其 中 中 国 国家 网 格 和 中 国 网 格 是 两 个 最 大 的 项 目 。 


5 个 高 性 能 计算 


设施 建设 和 网 格 技术 研 


国家 网 格 、 中 国 


国 网 格 ; 国家 基金 委 文 


钦 件 ” 重 大 专项 的 文 
家 单位 ，700 多 名 研究 人 员 
4 研究 课题 。 二 期 建 
步 完善 和 改进 高 性 能 计算 机 和 风格 服 务 


开放 的 网 格 环境 。 


算 中 心 的 曙光 5000A。 其 它 节 点 分 别 设 在 清华 大 学 、 山 东 大 学 、 中 国 科 技 大 学 、 香 港大 学 、 


安 交 


中 科 院 深圳 先进 技术 研究 院 、 华 中 科技 大 学 、 西 


通 大 学 和 北京 应 用 物理 


与 计算 数学 研究 


所 。 通 过 自主 开发 的 网 格 软件 ， 中 国 国家 网 格 能 够 支撑 网 格 环境 的 运行 和 应 用 网 格 的 开发 。 


中 国 国 家 网 格 的 应 
了 10 个 行业 应 用 网 格 : 


- ”国家 地 址 调查 应 用 网 格 
- ”航空 制造 应 用 网 格 

一 ”中国 气象 应 用 网 格 

一 ”科学 数据 应 用 网 格 

一 ”新药 发 现 应 用 网 格 

- ”生物 信息 应 用 网 格 

一 ”数字 林业 应 用 网 格 

一 ”仿真 网 格 

油气 地 震 勘 探 应 用 网 格 
交通 信息 服务 应 用 网 格 。 


二 期 的 应 用 网 格 是 : 


一 ”中国 气象 应 用 网 格 

一 ”水利 应 用 网 格 

- ”天 体 大 规模 并 行 数值 计算 软件 平台 
一 ”中 医药 数据 网 格 
- ”高 性 能 计算 化 学 应 用 系统 
一 ”药物 研发 网 格 


- ”基于 网 格 的 铁路 货运 信息 综合 应 用 系统 


- ”科学 数据 网 格 


] 集 中 在 资源 环境 、 科 学 研究 、 服 务 业 和 制造 业 4 个 领域 , 一 期 包括 
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这 些 应 用 网 络 在 推进 行业 应 用 , 共享 行业 内 的 资源 上 发 挥 了 很 好 的 作用 , 但 有 显示 度 的 


3.3.2 中 国 网 格 


中 国教 育 科 研 网 格 〈ChinaGrid) 是 在 教育 部 “十 五 ” 211 工程 的 公共 服务 体系 建设 重大 
专项 的 支持 下 建设 的 。 一 期 的 建设 时 间 是 2003 到 2005 年 ， 目 的 是 充分 利用 中 国 国 家 教育 科 
研 网 CERNET 上 的 计算 资源 和 信息 资源 ,建立 聚合 能 力 超 16TFlops, 总 存储 容量 超过 180TB， 
实现 有 效 共享 的 国家 教育 科研 服务 平台 。 参 加 ChinaGrid 计划 第 一 期 建设 的 高 校 有 20 所 ， 
联合 开发 了 中 国 网 格 支撑 平台 (ChinaGrid Support Platform, CGSP)。 目 前 ChinaGrid 上 的 典 
型 应 用 网 格 包 括 : 图 像 处 理 网 格 、 生 物 信 息 网 格 、 大 学 课程 在 线 网 格 、 海 量 信 息 处 理 网 格 和 
计算 流体 力学 网 格 。 这些 应 用 网 格 在 共享 大 学 内 的 资源 上 起 到 很 好 的 示范 作用 , 推动 了 各 大 
学 高 性 能 计算 的 普及 应 用 。 


第 二 期 是 从 2009 年 到 2010 年 底 , 校园 网 格 规 模 从 20 所 大 学 扩展 到 50 所 , 主要 任务 有 : 
(1) 建设 6 个 高 性 能 计算 网 格 中心 ; (2) 围绕 8 个 关键 性 的 科学 应 用 建设 e-Research 网 格 ， 
开发 网 格 应 用 ; (3) CGSP 的 研究 与 开发 。 


4 ”高 性 能 计算 联盟 


4.1 高 性 能 计算 机 专业 委员 会 


中 国 计 算 机 学 会 高 性 能 计算 专业 委员 会 (简称 高 专 委 ) 是 中 国 高 性 能 计算 机 会 议 
(HPCChina) 的 主办 机 构 ， 高 专 委 的 主任 委员 是 陈 国 良 院士 ， 副 主任 委员 是 述 学 斌 、 孙 凝 
晖 、 漆 锋 滨 ， 秘 书 长 是 张云泉 。 高 性 能 专 委 的 目的 是 : 


@ 促进 中 国 高 性 能 计算 研究 的 发 展 ， 主 办 中 国 高 性 能 计算 年 会 (HPCChina); 
@ 为 研究 人 员 、 工 业界 人 士 和 高 性 能 应 用 人 员 通 过 免费 的 平台 和 会 议 提供 专业 培训 ; 
@ 为 政府 在 高 性 能 计算 战略 规划 上 出 谋划 策 。 


中 国 高 性 能 计算 年 会 会 议 参照 国际 超级 计算 大 会 (Supercomputing Conference) 的 模式 ， 
涉及 的 领域 包括 高 性 能 计算 机 、 高 性 能 存储 、 高 性 能 网 络 、 高 性 能 计算 应 用 、 数 据 分 析 、 网 
等 ， 会 议 的 形式 包括 学 术 会 议 、 用 户 论坛 、 技 术 论 坛 、 企 业 论 坛 、 企 业 展 览 、 研 究 机 构 技 
术 展 览 、 培 训 、 研 究 生 教育 等 ， 并且 与 中 国 软件 行业 协会 数学 软件 分 会 合作 ， 发 布 中 国 高 性 
能 计算 机 Top100 评选 结果 。 中 国 高 性 能 计算 年 会 广泛 吸引 了 学 者 、 企 业界 人 士 、 用 户 代 表 、 
研究 生 、 媒 体 的 参与 ， 参 会 人 员 近 300 人 。 中 国 高 性 能 计算 年 会 与 产业 界 和 媒体 长 期 合作 ， 
已 经 成 为 中 国 高 性 能 计算 领域 的 盛会 , 也 成 为 国内 外 企业 展示 技术 、 与 用 户 交 流 的 重要 平台 。 


4.2 高 性 能 计算 机 标准 化 委员 会 


在 国家 工业 和 信息 产业 部 的 支持 下 ， 高 性 能 计算 机 标准 工作 委员 会 〈 简 称 高 标 委 ) 于 
2007 年 3 月 28 日 正式 成 立 。 高 标 委 是 中 国电 子 工 业 标准 化 技术 协会 的 直属 分 支 机 构 ， 接 受 
信息 产业 部 、 民 政 部 民间 管理 局 的 业务 指导 和 监督 管理 。 主 要 的 目的 是 : 


e@ 建立 工业 界 、 学 术 界 和 政府 之 间 沟 通 桥梁 ; 
e ”从 事 高 性 能 计算 标准 化 和 相关 标准 的 研究 ; 
e@ ”提供 标准 化 相关 的 培训 ， 提 高 标准 化 意识 。 


政府 有 引导 和 制定 标准 的 传统 , 但 高 标 委 希望 通过 企业 基于 公平 开放 的 原则 形成 标准 


六 


= 


化 
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性 能 计算 机 安全 、 机 群 操作 系统 、 个 人 高 性 能 计算 机 、 高 性 能 计算 机 应 用 、 基 础 染 


公司 、 东 方 通 公 司 、Platform 公司 、 北 京 市 气象 局 等 30 余 家 机 构 加 入 。《 机 群 操 作 系 


的 新 机 制 。 高 性 能 计算 服务 器 还 不 在 国际 标准 化 组 织 (ISO) 之 列 ， 高 标 委 设 刀片 式 服务 器 、 
局 


& 构 、 节 


能 和 知识 产权 八 个 工作 组 。 已 经 有 曙光 公司 、 联 想 公 司 ` AMD 公司 、 中 科 院 计算 所 、Mellanox 


统 远程 


监控 技术 要 求 》(SN: S07018-T) 和 《 刃 片 式 服务 器 管理 模块 技术 要 求 》(SN: S07019-T) 已 
通过 电子 行业 标准 立项 ， 在 2008 年 成 为 行业 推荐 标准 。 当 前 ， 高 标 委 的 主要 工作 是 与 企业 


合作 制定 中 国 刃 片 式 服务 器 标准 ， 包 括 基 础 架构 、 监 探 管 理 、 计 算 刀 片 、 交 换 模块 、 
块 等 方面 ， 得 到 了 微软 、IBM、 英特尔 等 国际 企业 的 合作 。 


存储 模 


为 了 促进 产业 界 接受 国内 的 标准 ，2008 年 高 专 委 成 立 了 中 国 两 性 能 计算 产业 联盟 ， 其 


成 员 包 括 8 家 公司 和 2 家 研究 机 构 。 此 外 ， 还 计划 发 展 高 性 能 计算 应 用 的 标准 ， 如 石 ; 


气 预 报 、 电 信和 国防 安全 。 
5 ”高 性 能 计算 研究 


中 国 的 高 性 能 计算 研究 涉及 到 比较 广 的 领域 ， 如 微 处 理 器 、 编 译 、 系 统 、 算 法 


以 及 应 


用 软件 等 。 除 了 几 个 领先 的 研究 机 构 从 事 高 性 能 计算 相关 的 关键 技术 研究 外 ， 还 有 超过 300 


所 的 高 校 及 行业 应 用 的 研究 机 构 都 在 应 用 层面 开展 相关 的 研究 。 
5.1 主要 研究 机 构 


中 科 院 计算 所 、 国 防 科大 和 江南 计算 所 是 公认 的 在 中 国 开展 全 方面 高 性 能 计算 技 
的 领先 研究 机 构 。 其 中 国防 科大 和 江南 计算 所 主要 涉及 与 国防 相关 的 研究 和 应 
华 大 学 在 机 群 计算 和 高 性 能 计算 系统 评测 领域 享有 盛誉 。 


5.1.1 中 国 科 学 院 计 算 技 术 研 究 所 
创建 于 1956 年 的 中 科 院 计算 所 被 视 为 中 国 计 算 机 产业 、 计 算 机 人 才 以 及 计算 机 


必用 。 此 外 ,， 清 


术 研 究 


公司 的 


摇篮 。 该 研究 机 构 由 于 独立 自主 研制 出 “ 瞩 光 ”超级 计算 机 和 类 MIPS 处 理 器 芯片 “ 龙 蕊 ” 


而 受到 全 世界 的 关注 。 
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图 1， 龙 芯 3 八 核 结构 
1.， 微 处 理 器 设计 
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龙 必 处理 器 是 中 科 院 计算 技术 研究 所 研制 的 CPU， 包括 3 个 系列 。 龙 蕊 3 是 目前 

中 国 设计 的 最 先进 的 CPU。 龙 芯 1 是 低 功 耗 的 处 理 器 他 核 ， 已 经 被 应 用 于 多 种 低 端 谋 

入 式 系 统 中 (如 基于 龙芯 的 销售 点 终端 和 收 税 计算 机 等 已 研制 成 功 并 已 投入 市 场 )。 龙 

芯 2 是 面向 桌面 应 用 的 低 成 本 计算 机 的 SoC 处 理 器 (如 基于 龙芯 -2F 的 笔记 本 已 投入 市 
场 )。 龙 芯 3 是 面向 服务 器 和 高 性 能 计算 机 的 多 核 处 理 器 ， 采 用 45 纳米 工艺 ， 龙 必 3 
四 核 处 理 器 将 首先 用 于 曙光 刀片 服务 器 和 由 中 国 科技 大 学 陈 国 良 教授 领导 的 团队 开发 
的 PHPC KD-60。8 核 处 理 器 将 用 于 曙光 6000 和 干 万 亿 次 高 性 能 机 和 中 国 科 大 下 一 代 
PHPC KD-50- III。 


8 核 龙芯 3 号 处 理 器 的 结构 如 图 1 所 示 ， 采 用 可 伸缩 二 维 Mesh 互 连 结构 ， 每 个 结 
点 有 两 级 AXI 交叉 开关 ， 第 一 级 AXI 交叉 开关 连接 四 个 处 理 器 以 及 分 成 四 个 体 的 共享 
二 级 缓存 〈Cache)， 并 与 东南 西北 四 个 方向 的 其 他 结 点 或 者 读 写 〈IO) 进行 互 连 ， 传 
递 缓存 一 致 性 相关 信息 ; 第 二 级 交叉 开关 连接 二 级 缓存 和 内 存 控 制 器 , 采用 标准 的 AXI 
协议 。 每 个 核 拥有 2 个 256 位 的 浮 点 向 量 运算 部 件 。 


2. 编译 技术 


中 科 院 计算 技术 研究 所在 编译 方面 的 代表 性 研究 成 果 是 开发 了 英特尔 安 腾 处 理 器 
的 编译 器 ORC， 该 编译 器 已 经 在 学 术 界 和 工业 界 广泛 使 用 。 与 龙 忆 3 处 理 器 紧密 相关 
的 编译 器 开发 工作 包括 二 进 制 翻译 和 向 量 编译 。 针 对 SPECCPU 测试 程序 ， 龙 蕊 编译 器 
的 二 进 制 翻译 已 经 可 以 获得 GCC 70% 的 性 能 , 龙芯 3 的 每 个 核 包 括 2 个 向 量 运算 部 件 ， 
因此 需要 向 量 编 译 。 


3. 高 性 能 计算 系统 


中 科 院 计算 所 多 年 来 都 处 于 中 国 高 性 能 计算 系统 研究 的 最 前 沿 , 尤其 是 在 技术 路 线 
研制 方面 ,是 SMP、MPP”、Cluster 和 超 并 行 高 性 能 计算 体系 结构 的 开创 者 和 领导 者 。 
中 科 院 计算 所 研制 的 曙光 系列 高 性 能 计算 机 包括 曙光 1 号 SMP 服务 器 、 曙 光 1000 MPP 
系统 、 上 曙光 2000 机 群 系统 、 曙 光 3000 SMP 机 群 系统 、 曙 光 4000 X86/Linux 机 群 系统 
以 及 曙光 5000 刀片 机 群 系统 。 最 近 发 布 的 星云 作为 曙光 6000 的 高 通 量 计 算 部 分 , 在 世 
界 超级 计算 机 中 排名 第 3, 其 Linpack 性 能 测试 达到 1 PFlops 以 上 。 曙光 6000 的 高 性 能 


二 计算 部 分 基于 龙芯 3 处 理 器 与 超 并 行 体系 结构 ， 目 前 正在 研发 中 。 此 外 ， 中 科 院 计算 所 
De 还 研制 超级 服务 器 、 个 人 高 性 能 计算 机 和 高 通 量 计 算 机 。 


除了 通用 高 性 能 计算 ,计算 所 也 开发 了 一 些 针 对 特殊 应 用 的 专用 高 性 能 计算 机 ， 如 : 面 
向 基因 测序 应 用 的 曙光 4000H、 面 向 网 络 安全 应 用 的 曙光 4000L， 正 在 研制 面向 国家 “和 蛋白 
质 大 科学 工程 ”应 用 的 超 龙 一 号 和 相应 的 并 行 算法 、 并 行 软 件 包 。 超 龙 一 号 是 一 台 和 集合 了 龙 
芯 3 四 核 处 理 器 、 现 场 可 编程 门 阵列 (FPGA) 加 速 卡 和 GPU 加 速 卡 的 百 万 亿 次 高 性 能 异 构 
超级 计算 机 。 


在 高 性 能 计算 相关 的 关键 技术 方面 , 计算 所 在 生物 信息 处 理 的 算法 研究 和 高 性 能 存储 系 
统 上 也 处 于 中 国 的 前 列 。 如 将 存储 虚拟 化 到 潜在 的 远程 服务 器 上 的 大 容量 网 络 存储 系统 “ 蓝 
鲸 ”， 最 近 已 经 商业 化 。 


5.1.2 国防 科技 大 学 
国防 科技 大 学 作为 中 国 高 性 能 计算 机 研制 的 主要 机 构 之 一 , 在 处 理 器 、 编 译 、 并 行 算法 、 


9 网 状 网 
10 Massively Parallel Processing， 大 规模 并 行 处 理 
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高 性 能 计算 机 等 方面 有 较 深 入 的 研究 。 国 防 科技 大 学 最 近 由 于 研制 出 中 国 第 一 台 PFlops 系 
统 天 河 一 号 ， 特 别 是 其 升级 版 天 河 -1A，2010 年 11 月 荣 登 世界 超级 计算 机 TOP 500 榜首 而 
受到 全 世界 的 关注 。 


国防 科技 大 学 研制 出 银河 飞腾 系列 流 处 理 器 YHFT64, 开发 了 一 种 新 型 的 流 编程 语言 一 
一 Stream FORTRAN95 (SF95) 及 其 编译 器 。 该 编译 器 采用 了 面向 流体 系 结构 的 优化 技术 ， 
包括 循环 流 化 (loop streamizing)、 向 量 流 化 〈vector streamizing) 和 流 重 用 〈stream reusing ) 
等 。 国 防 科技 大 学 研制 的 银河 系列 超级 计算 机 已 经 被 装备 到 气象 和 国防 应 用 。 
此 外 ,国防 科技 大 学 在 数值 气象 预报 并 行 算法 、 遥 感 图 像 并 行 算法 、 分 子 动 力学 相关 的 
并 行 算法 、 经 典 数学 问题 的 并 行 算法 上 有 深入 研究 , 还 开发 了 面向 服务 器 的 具有 高 安全 等 级 
的 腊 记 操作 系统 。 
5.1.3 清华 大 学 


清华 大 学 计算 机 科学 与 技术 系 成 立 至 今 已 有 接近 50 年 的 历史 ， 在 国内 享有 盛誉 ， 在 机 
群 计算 、CPU 设计 、 网 格 计算 、 网 络 存储 和 高 性 能 系统 评测 等 领域 都 有 很 强 的 研究 实力 。 


I 1. ”机 群 计 算 


bm 


人 

Ql 清华 大 学 的 主要 研究 方向 是 并 行 计算 所 需 的 各 种 工具 ， 如 并 行 调试 器 、 容 错 工具 、 
已 性 能 调试 、 并行 化 编译 等 , 另外 还 包括 机 群 计算 的 实际 应 用 程序 的 开发 , 如 生物 信息 学 、 
S 电力 系统 模拟 与 仿真 等 。 近 年 来 取得 的 典型 研究 成 果 包 括 : 

re @ 基于 用 户 级 文件 系统 的 文件 操作 缓冲 技术 ; 

~ e 基于 虚拟 机 技术 的 虚拟 机 群 

= e@ ”数据 回 深 和 序 回 深 相 结合 的 并 行程 序 调试 技术 。 

CN 


2. ”系统 评测 


2007 年 11 月 ，863 计划 高 性 能 计算 机 及 其 核心 软件 专项 在 清华 大 学 成 立 了 "863 高 
性 能 计算 机 评测 中 心 "。 该 中 心 的 工作 主要 包括 高 性 能 计算 机 测试 标准 和 测试 方法 的 下 


= 究 、 开 发 与 实施 ， 为 高 性 能 计算 机 系统 的 研制 厂商 与 用 户 提供 公正 、 标 准 的 测试 服务 。 
© 在 性 能 评测 技术 方面 ， 该 中 心 着 重 进行 性 能 预测 研究 ,通过 建立 分 层次 的 性 能 模型 ， 支 
持 功 能 、 性 能 故障 的 分 析 。 


5.2 并 行 算法 

中 国 在 并 行 算 法 的 研究 领域 包括 经 典 问题 的 并 行 化 、 多 核 处 理 器 上 的 并 行 算 法 、 大 规模 
并 行 算 法 和 并 行 编程 工具 等 。 中 国 目 前 有 实际 应 用 背景 的 并 行 算法 的 最 大 规模 在 4000 核 左 
右 ， 极 个 别 算法 能 突破 1 万 核 并 行 度 。 中 国 在 并 行 算法 领域 取得 的 典型 成 果 包 括 : 
中 科 院 软件 所 在 方程 求解 器 和 预 条 件 技术 上 的 研究 ; 
中 国 科学 院 计算 数学 与 科学 工程 计算 研究 所 在 自 适应 有 限 元 算法 上 的 研究 ; 
北京 应 用 物理 与 计算 数学 研究 所 在 自 适 应 多 重 网 格 算法 上 的 研究 ; 
中 国 科 学 院 过 程 工程 研究 所 在 多 尺度 方法 上 的 研究 。 
5.3 高 性 能 计算 软件 

近年 来 , 中 国 在 高 性 能 计算 硬件 研制 方面 取得 了 重要 的 进展 , 但 是 相对 注 弱 的 软件 开发 
和 稀缺 的 高 端 应 用 限制 了 国家 高 性 能 计算 的 发 展 ,大 多 数 的 中 国 大 学 和 研究 机 构 都 活跃 在 高 
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pa 


性 能 计算 硬件 的 研究 , 但 对 相关 软件 
期 被 以 ANSYS、NASTRAN 和 LS-DYNA 等 为 代表 的 国外 供应 商人 垄断 。 高 端的 
国家 。 在 计算 规模 方面 ， 能 够 扩 
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人 

包 也 主要 来 自 美国 、 日 本 以 及 欧洲 

非常 少 ， 而 达到 上 万 核 规模 的 并 行 应 用 至 今 仍 属 空白。 
尽管 中 国 在 高 性 能 计算 软件 开发 


开发 方面 还 是 取得 了 进 


pA 


展 。 前 者 的 代表 性 工作 是 中 


设计 的 3 


行程 序 开 发 平 
用 支撑 软件 框架 JASMIN。 自 主 应 用 软 伯 


上 整体 比较 落后 , 在 并 行 软件 开发 平台 和 自主 应 
国 科学 院 计 算数 学 所 的 3 维 自 适应 有 限 元 


上 京 应 用 物 到 


台 PHG 和 了 


F 包 大 多 月 


与 计算 数学 研究 所 的 并 行 自 适应 结构 


Vol.9 No.4 
Jul. 2011 


开发 却 较 少 涉足 ,在 工业 界 应 用 极为 广泛 的 CAE 软件 ， 


源 软 件 
展 到 上 千 核 规模 的 应 用 还 


用 软件 


网 格 应 


日 于 石 ; 


勘探 、 气 


等 传统 高 性 能 计算 应 用 


领域 。 突 出 的 例子 如 PRIS、GeoEast 和 Grapes， 这 些 软件 均 已 成 功 在 生产 实践 中 得 到 使 用 。 


5.3.1 PHG 


PHG (Parallel Hierarchical Grid) 是 中 国 科学 院 科 学 与 工程 


组 


专门 为 


自 适应 有 限 元 设计 的 并 行程 序 开发 3 


言 开发 ， 基 于 MPI 


计算 


PHG 通过 面向 对 象 的 数据 结 


结构 。PHG 处 理 的 网 格 对 象 是 一 维 、 二 维 三 角 


消息 传递 机 制 实现 3 


构 以 及 用 户 接 口 实现 了 并 行 网 格 
剖 分 、 动态 负载 平衡 和 网 格 
适应 加 密 与 放 粗 , 在 隐藏 3 


PETSc， 
局 部 自 


行 细节 


的 同时 为 并 行 


自 适应 有 限 元 程序 
的 开发 提供 了 足够 的 灵 
通过 PHG 灵活 的 自 | 


Built- 


活性 。 用户 
度 (DOF) 管 


亡 


至 


模块 能 轻松 完成 有 


限 元 离散 和 


刚度 矩阵 的 组 装 ， 通 过 线性 解法 器 


或 特 生 


E 值 解法 器 接 
成 方程 组 和 特征 值 


口 能 方便 地 完 
问题 的 求解 。 


PHG 支持 将 计算 结 


果 以 VTK 或 


行 。 PHG 的 研 
究 ” 和 国家 自然 科学 基金 的 支持 。 


HYPRE， 


SPOOLES， 


in PCG 


F 人 台 〈 见 图 


计算 国家 重点 实验 室 开 发 的 


Trilinos/AztecOO, 
MUMPS, SuperLU， 


2)， 其 核心 是 分 布 式 的 
形 和 三 维 四 面体 协调 网 格 。PHG 采用 C 语 
所 得 到 了 国家 973 项 目 “ 高 性 能 科学 


层次 网 络 


并 行 结构 网 格 (Parallel Hierarchical Grid) 


PARPACK, 
Trilinos/Anasazi; 
JDBSYM， 
LOBPCG， 


特征 值 
求解 器 


METIS/ParMETIS 


三 维 目 适应 有 


限 元 设计 的 并 行 


程序 ] 


于 发 平台 PHG 的 结构 


OpenDX 的 格式 输出 进行 可 视 化 处 理 .-PHG 提供 了 与 包括 PETSc、HYPRE、Trilinos、MUMPS、 
SuperLU_Dist、SPC、 LASPack、 PARPACK、 LOBPCG、 SLEPC、 Tc/Tk、 VTK、 Zoltan、 


ParMETIS、METIS 等 众多 软件 的 接 


5.3.2 JASMIN 


JASMIN 框架 由 北京 应 用 物理 


针对 科学 计算 1 


基于 消息 传递 接口 


JASMIN 框架 通过 封装 数据 结构 ， 
用 的 底层 计算 技术 ,支撑 
架 ， 用 户 无 需 亢 悉 3 


的 结构 网 格 应 用 ， 借 鉴 了 美 区 
实验 室 的 SAMRAI 框架 , 其 架构 如 图 


MPI 实现 并 行 计 算 ，2009 锯 


LE 与 计算 数学 研究 所 研 各 


小 全 称 为 并 行 自 适应 结构 网 格 应 用 
支撑 软件 框架 (J parallel Adaptive Structured Mesh applications INfrastructure )。JASMIN 框架 
劳伦斯 利 弗 莫 尔 (Lawrence Livermore) 
3 所 示 。JASMIN 框架 基于 C++ 和 Fortran77 语言 编 


国家 
制 |， 


FE2 月 发 布 了 JASMIN1.5 版 。 


1 Computer Aided Engineering， 计 算 机 辅助 工程 分 析 


集成 成 熟 的 数值 
用 户 在 物理 建 模 、 数 值 方法 、 
行 计算 、 自 适应 计算 和 高 性 能 算法 
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算法 ,| 


二 
=] 


: 瑞 大 规模 3 


I 


性 能 算法 上 的 创新 研究 。 基 于 该 杠 


的 实现 


行 网 格 自 适应 应 


节 ， 根 据 离 散 格式 、 初 边 值 
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条 件 和 误差 评估 方法 ， 就 可 以 研制 高 效率 的 并 行 应 用 程序 ， 求 解 偏 微分 方程 。JASMIN 是 一 
个 开放 的 支撑 软件 框架 ， 创 新 的 数值 方法 和 高 性 能 算法 可 以 不 断 地 集成 到 该 框架 中 。 


JASMIN 框架 特别 适 于 求解 多 物理 、 多 尺度 、 多 介质 、 多 组 分 的 复杂 流动 问题 的 并 行 应 
用 程序 的 快速 开发 。JASMIN 框架 支撑 “ 单 块 均匀 和 矩形 ”和 “ 单 块 变形 ”两 类 单 层 结构 网 格 ， 
并 在 此 基础 上 支持 由 多 个 单 块 结构 网 格 协调 拼接 而 成 的 多 块 结构 网 格 , 以 及 自 适应 加 密 的 多 
层 网 格 结构 。 在 自 适应 结构 网 格 之 上 ，JASMIN 支持 两 类 自 适 应 计算 ， 即 h- 自 适应 和 六 自 适 
Yo 


JASMIN 框架 的 核心 数据 结构 为 网 格 片 。 通 过 调整 网 格 片 的 尺寸 ， 可 以 使 并 行程 序 更 好 
地 适应 微 处 理 器 的 多 级 存储 体系 结构 。 数 值 模拟 过 程 中 所 输出 的 大 规模 数据 场 以 HDF5 的 格 
式 存储 ， 可 以 由 并 行 与 分 布 可 视 化 系统 JaVis 实施 交互 式 可 视 化 分 析 。 


ai ，. 站 i， 物理 数学 个 性 层 : 


pp 和 [P| 


a 

' 人 ete 1 H 

;物理 模型 :计算 参数 ; ;计算 方法 ; :高效 算法 ; … ;专家 经 验 ;实现 JASMIN 的 抽象 接口 阳 数 
应 


支撑 JASMIN 实 际 应 用 的 抽象 接口 函数 


Interface Function for User Application 


多 时 间 积 分 算法 面向 应 用 的 计算 工具 时 间 积 分 算法 | 类 
MultiHierarchy Time Integrator Application Utilities 自 适应 算法 


< 几何 描述 S 

时 间 积 分 算法 网 格 几 何 求解 器 求解 器 要 

Hierarchy Time Integrator||Grid Geometry Solvers 计算 工具 箱 三 

志 

网 格 自 适应 数据 传输 | 

Mesh Adaptivity Communication Math. Ops. 数学 运算 

两 客 片 层次 结 和 村 数据 片 加 和 
Patch Hierarchy Patch Data 数据 


基本 工具 箱 ToolBox 基本 工具 


图 3，JIAMIN 架构 
5.3.3 PRIS 


PRIS 由 中 国 科 学 院 软件 研究 所 并 行 软件 研究 开发 中 心 开发 ， 是 针对 油 藏 数值 模拟 的 能 
够 有 效 地 处 理 井 、 断 层 等 油田 特性 的 并 行 线性 求解 器 。1997 年 形成 PRIS 1.0 PVM 版 ，1998 
年 形成 PRIS 1.0 MPI 版 ，1999 年 通过 大 庆 油 田 百 万 网 格 点 数据 测试 ，2000 年 4 月 通过 了 美 
Baker Atlas SSI 公司 的 测试 ，2000 年 9 月 发 布 了 PRIS 2.0 版 。 


PRIS 支持 数据 并 行 方式 ， 适 用 于 MPP 和 机 群体 系 结构 的 并 行 计算 机 。PRIS 采用 克 雷 
洛 夫 (Krylov) 子 空间 方法 求解 线性 方程 组 , 其 中 克 雷 洛 夫子 空间 方法 采用 混合 预 处 理 技术 ， 
集成 了 加 法 Schwartz、ILU2 分 解 、 克 雷 治 夫子 空间 迭代 、 约 束 剩余 等 预 条 件 子 。 针 对 不 同 
的 迭代 算法 ，PRIS 自动 选取 相应 的 预 条 件 子 组 合 。PRIS 采用 独立 的 模块 子 程序 来 支持 并 行 
程序 消息 传递 ， 目 前 支持 MPI 与 PVM。 


5.3.4 GeoEast 


2” IncompleteLU， 不 完全 LU 分 解 
3 parallel virtual machine, 并 行 虚拟 机 


20 


第 9 卷 第 4 期 信息 技术 快报 Vol.9 No.4 
Information Technology Letter Jul. 2011 
高 性 能 计算 在 物探 信息 的 数据 处 理 和 人 解释 中 扮演 关键 角色 。 在 物探 数据 处 理 软 件 中 , 美 
西方 地 球 物理 公司 (WGC) 的 OMEGA 和 法 国 CGG 公司 的 GeoCluster 在 市 场 中 占有 大 
名 分 份额 。 面 对 中 国 石油 物探 业务 的 快速 国际 扩张 ，WGC 于 2002 年 宣布 ， 不 再 向 中 国 石 
集团 出 售 OMEGA 软件 及 其 升级 版 本 。 法国 CGG 公司 随后 也 提出 了 苛刻 的 出 售 软件 的 限 
上 和 条件， 包括 软件 仅 限 在 中 国 本 土 使 用 ， 不 能 处 理 源 自 中 国 石油 集团 海外 业务 的 地 震 资料 ， 
在 软件 使 用 的 过 程 中 要 随时 接受 核查 等 。 这 些 限 制 使 中 国 石油 集团 的 国际 竞争 力 大 打折 扣 。 


在 这 样 的 背景 下 ，2003 年 1 月 ， 中 国 石油 集团 投资 1.4 亿 元 ,开始 自主 研发 物探 处 理解 
释 一 体 化 软件 。 经 过 两 年 攻关 ， 具 有 自主 知识 产权 的 GeoEast 物探 处 理解 释 一 体 化 系统 问 
世 。 这 是 中 国 油气 勘探 软件 发 展 史 上 一 个 具有 里 程 碑 意 义 的 事件 , 结束 了 西方 公司 长 期 在 该 
领域 的 垄断 历史 。 


GeoEast 的 技术 特点 包括 : 


@ ”用 户 环境 : 一 个 主 控 界 面 ， 用 于 激发 与 返回 数据 。 
@ ”数据 环境 统一 的 数据 接口 ， 如 转 储 功 能 接口 、 文 件 系 统 接口 、 磁 盘存 储 接 
ms 支持 Lustre 并 行文 件 系统 。 
人 e@ 运行 环境 : 
Ny (1) ”满足 地 震 资料 处 理 的 特殊 需求 的 作业 调度 功能 
EN (2) ”可 视 化 的 磁带 设备 管理 界面 与 工具 ; 
(3) “对 几 百 个 功能 模块 的 组 装 、 加 载 工具 ; 
(4) ”I/O 管理 工具 。 
@ 开发 环境 ; 基于 交互 、 批 处 理 、 可 视 化 三 个 框架 的 开发 工具 。 
e@ ”核心 应 用 功能 : 包括 处 理 、 解 释 、 一 体 化 三 类 。 
@ 通信 平台 : 类 似 于 COBRA 的 RPC。 


CN 5.3.5 全 球 /区 域 多 尺度 通用 同化 与 数值 预报 系统 
2 GRAPES 是 中 国 具有 自主 知识 产权 的 "新 一 代 全 球 /区 域 多 尺度 通用 同化 与 数值 预报 系 
统 "。GRAPES 中 的 短 时 临近 天 气 预报 系统 ， 曾 作为 唯一 的 中 国 发 展 的 预报 系统 ， 加 入 世界 


气象 组 织 北 京 2008 年 奥运 会 预报 示范 和 研究 示范 计划 ， 为 奥运 会 提供 气象 服务 。2009 年 5 
月 GRAPES 被 投入 到 中 国 气 象 中 心 准 运作 。 


Te 


起 


眉 


O GRAPES 在 创新 上 有 三 个 重要 进展 : 


@ 建立 起 中 国 首 个 能 够 直接 同化 卫星 辐射 观测 资料 的 同化 系统 ; 

@ 采用 多 尺度 通用 动力 框架 作为 不 同 应 用 模式 的 共同 基础 ， 实 现 了 静 力 与 非 静 力 可 
选 、 全 球 与 有 限 区 域 可 选 、 水 乎 与 垂直 分 辨 率 可 选 的 通用 框架 

@ 在 提高 预报 准确 率 、 可 用 预报 时 效 和 预报 精细 程度 方面 具有 较 好 的 性 能 ， 水 平 精细 
度 可 以 达到 1 一 2 公里 ， 可 以 对 台风 、 暴 雨 等 强 对 流 天 气 取得 较 好 的 预报 结果 。 


6 中国 高 性 能 计算 应 用 与 用 户 需 求 


目前 中 国 的 高 性 能 应 用 主要 集中 在 科学 计算 、 能 源 、 气象 、 工 业 仿 真 、 金 融 等 传统 领域 。 
同时 一 些 新 的 领域 , 如 影视 动画 、 在 线 网 络 游戏 对 高 性 能 计算 的 需求 强劲 ， 发展 速度 比较 迅 
独 。 在 一 些 国 家 重大 活动 中 ， 高 性 能 计算 起 到 了 重要 作用 。 比 如 2009 年 建国 60 周年 阅兵 中 
仿真 装备 对 城市 道路 、 桥 梁 可 能 的 损伤 ，2010 年 上 海 世博 会 中 仿真 70 万 人 群 在 发 生意 外 时 
的 疏散 方案 。 


21 


中 国 高 性 能 计算 研究 与 应 用 调查 报告 


当今 , 中 国 高 性 能 应 用 普遍 存在 , 需要 大 量 同时 掌握 高 性 能 计算 技术 和 特定 应 用 领域 知 
识 的 专业 人 员 。 然 而 ， 中 国 高 性 能 计算 发 展 的 历史 相对 较 短 ， 只 有 一 部 分 高 校 开 设 了 高 性 能 
计算 课程 。 在 人 才 培 养 方面 , 目前 国内 科学 计算 中 的 自主 开发 的 并 行 软件 大 多 还 是 由 计算 机 
专业 出 身 的 科技 人 员 将 其 他 学 科 现 有 串 行 程序 改写 为 并 行程 序 , 但 是 具备 写 并 行程 序 能 力 的 
其 他 学 科 的 研究 人 员 数 目 呈 上 升 趋势 。 以 中 科 院 超 算 中 心 为 例 ,该 中 心 每 两 个 月 就 举办 一 次 
针对 非 计算 机 专业 的 应 用 人 员 的 并 行 计算 培 训 。 在 中 科 院 研究 生 院 的 课程 设置 中 ,， 有 针对 非 
计算 机 专业 研究 生 设 置 的 并 行 计算 选修 课 。 
6.1 科学 计算 应 用 
正如 83.2.1 和 83.2.2 提 到 的 ， 中 国 两 个 最 快 的 超级 计算 机 一 一 上 海 超 算 中 心 的 曙光 
5000A 和 中 国 科 学 院 超 算 中 心 的 深 腾 7000 主要 用 于 科学 计算 ， 说 明科 学 研究 依然 是 中 国 高 
性 能 计算 应 用 的 最 主要 领域 。 上 海 超 算 中 心 2008 年 的 年 度 报告 显示 ， 当 年 共有 200 多 个 研 
究 团 体 使 用 上 海 超 算 的 计算 资源 。 研 究 成 果 包 括 : 114 篇 SCI 索引 的 论文 和 7 篇 发 表 于 顶级 
期 刊 如 《物理 评论 快报 》(PRL) 和 《美国 化 学 会 志 》(JACS) 上 的 文章 。 中 科 院 超级 计算 
中 心服 务 的 对 象 主要 是 科学 院内 的 各 个 研究 所 ， 应 用 基本 上 都 是 和 科学 计算 相关 。 
科学 计算 具有 一 些 共同 的 特点 ， 如 数据 量 庞大 、 计 算 复杂 性 高 、 多 为 开源 软件 。 
@ 大 规模 数据 处 理 
典型 例子 : 


- ”中科院 高 能 物理 研究 所 正 负电 子 对 撞 机 实验 -数据 的 处 理 。 在 对 撞 机 中 ， 每 一 对 粒 
子 的 碰撞 是 完全 独立 的 , 在 一 次 实验 中 可 能 会 发 生 上 万 次 这 样 的 碰撞 ,探测 器 探测 
到 的 一 次 碰撞 结果 的 数据 量 在 1GB 左右 ， 所 以 要 处 理 的 数据 量 极 大 。 由 于 高 能 物 
理 是 基础 性 的 研究 , 同时 受到 实验 设备 的 限制 ,高 能 物理 领域 的 全 球 合作 非常 广泛 ， 
因而 针对 高 能 物理 的 软件 几乎 都 是 共享 的 。 该 应 用 软件 分 为 三 个 层次 ， 最 底层 的 
Linux 操作 系统 、 中 间 开 源 的 物理 计算 平台 软件 、 上 层 的 针对 每 个 具体 问题 开发 的 
应 用 软件 。 
- ”位 于 西藏 羊 八 井 的 中 - 意 AR60 实验 探测 宇宙 射线 数据 处 理 .每 次 实验 获得 的 数据 是 
量 完全 独立 的 数据 组 ,但 由 于 每 次 实验 的 代价 很 高 , 因而 这 些 数据 需要 永久 保存 ， 
一 以 供 以 后 的 研究 使 用 。 目 前 的 系统 有 6.4PB 存储 设备 ，2500 个 核 的 计算 能 力 。 隧 
© 着 探测 手段 的 提高 和 实验 项 目的 扩展 , 获得 的 数据 量 不 断 增加 。 用户 需要 一 个 统一 
的 存储 系统 ,而 不 是 多 个 甚至 多 种 存储 介质 ,这 就 需要 大 规模 数据 管理 的 技术 ， 同 
时 大 数据 量 也 需要 提高 TO 吞吐 性 能 。 
e@ ”超新星 爆炸 模拟 
南京 天 文 台 的 模拟 超新星 爆发 过 程 的 应 用 ， 在 深 腾 7000 上 使 用 8192 个 核 进行 了 
687 亿 个 网 格 的 计算 ， 这 是 目前 国内 科学 计算 应 用 中 采用 核 数 最 多 的 。 得 到 计算 结果 以 
后 ， 需 要 通过 体 绘制 的 方法 将 数据 用 图 像 的 形式 实时 地 显示 出 来 ， 由 于 网 格 数 巨大 ,所 
以 这 一 部 分 工作 也 必须 借助 于 高 性 能 计算 机 。 
6.2 能 源 领域 的 应 用 
地 球 物理 勘探 (简称 “物探 ) 是 利用 地 过 中 岩 ( 矿 ) 石 物理 性 质 的 差异 来 研究 地 质 构造 或 探 
测 地 下 矿产 的 一 门 科学 。 它 是 以 各 种 岩石 和 矿石 的 密度 、 磁 性 、 电 性 、 弹 性 、 放 射 性 等 物理 
性 质 的 差异 为 研究 基础 ,用 不 同 的 物理 方法 和 物探 仪器 探测 地 球 物理 场 的 变化 , 通过 分 析 所 
获得 的 物探 资料 , 推断 、 解 释 地 质 构造 和 矿产 分 布 情况 。 目 前 主要 的 物探 方法 有 : 重力 勘探 、 
磁 法 勘探 、 电 法 勘探 、 地 震 勘探 、 放 射 性 勘探 等 。 其 中 目前 工业 界 广泛 采用 的 勘探 方法 是 地 
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中 国 的 油气 探测 领域 , 高 性 能 计算 在 数据 处 理 


且 该 领域 的 应 用 需求 仍 在 不 断 增长 。 以 中 国 领先 


的 地 球 物 到 
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和 油气 探测 信息 的 解释 起 到 重要 作用 , 并 
服务 公司 (BGP) 为 例 ， 虽 然 该 


公司 已 经 拥有 15,000 个 计算 节点 ， 总 计算 能 力 达到 200 TFlops，BGP 仍 希望 每 15 个 月 将 计 


算 能 力 翻 盔 。 
增 大 ， 基 于 刀片 的 集群 所 需 的 空间 随 之 增 大 ， 水 人 


6.2.1 油气 应 用 中 计算 机 发 展 历史 


示 


理 


1 


进行 操作 ， 包 括 地 震 数 据 处 理 


统 附 加 数组 处 理 机 后 ， 价 格 只 增加 十 分 之 一 ， 
中 国 石油 应 用 使 用 过 的 典型 系统 包括 : IBM 2938 数组 处 班 


经 历 了 4 次 习 


机 是 


向 处 型 


组 处 理 机 (1974 年 ) 和 FPS 公司 的 AP-120B 数组 处 理 机 (1975 年 )。 


1980 年 代 


Cray-YMP(1988 年 )，IBM3090(1985 年 ) 和 国防 科技 大 学 的 YH-1 
工作 站 和 并 行 计算 机 。 交 互 处 理应 用 在 UNIX 了 


1990 年 代 


[ 作 站 


由 于 对 高 性 能 系统 的 依赖 ，BGP 同样 面临 高 能 耗 的 挑战 。 随 着 计算 机 规模 的 
症 冷 系统 将 会 更 加 复杂 。 


中 国 油 气 应 用 中 高 性 能 计算 的 发 展 历史 与 计算 机 体系 结构 的 发 展 密 不 可 分 。 如 图 4 所 
， 过 去 的 40 年 里 ， 该 领域 使 用 的 计算 机 系统 
EE 服务 公司 (CGGVeritas) 使 用 的 计算 机 和 BGP 
1970 年 代 一 一 主机 + 数组 处 理 机 。 数 组 处 型 
P 常 用 的 相关 、 裙 积 和 快速 全 


大 变革 。 全 球 最 大 的 地 球 物 
在 这 四 个 阶段 的 对 比 见 附 表 D。 

种 外 部 向 量 协 处 理 器 ， 可 以 对 数组 
E 叶 变换 (FFT)。 主 机 系 
地震 数 据 的 性 能 提高 
E 机 (1969 年 )，IBM 3838 数 


四 倍 以 上 。 


向 量 计 算 机 。 使 用 过 的 典型 系统 包括 : Cray-XMP(1982 年 )， 
巨型 机 (1983 年 )。 


上 运行 ， 批 量 处 理 


应 用 在 并 行 计算 机 上 运行 。 使 用 过 的 工作 站 包括 : ”DECstation 3100 (1989 年 )，IBM 


RISC System/6000 (1990 年 )。 使 用 过 的 3 


行 计算 机 包括 : IBM Scalable Power 


PARALLEL 2(1994 年 ，MPP)，Convex SPP-1000 (1994 年 ，DSM)，SGI Origin 2000 


(1996 年 ，cc-NUMA)。 


2000 年 代 一 一 机 群 计算 机 (Cluster)。 主 要 使 用 


GeoCluster， 所 有 CGG 软件 都 支持 Linux， 并 基于 机 群 架 构 优 化 。 


蚌 尊 洋人 天 开 港 类 讲 业 


1960 1970 


图 4， 地 震 数据 处 理 算法 的 复杂 性 


1980 
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1990 
主机 ”数组 处 理 机 向 量 计算 机 MPP 


2000 
集群 计算 机 


E 随 计算 机 技术 发 


CGG 公司 的 软件 。2000 和 


2010 
223 


展 


FE CGG 推出 


人 多 上 


多 本 以 


中 国 


能 计算 看 


a 性 


随 着 计算 能 力 和 存储 容量 的 提高 ， 油 气 4 


调查 报 4 


也 球 物理 计算 方法 也 不 断 发 


a 
口 


展 。 在 20 世纪 60 


年 代 ， 计 算 机 只 能 够 进行 简单 的 地 震 道 计算 ，20 世纪 70 年 代 出 现 数 组 处 理 机 (也 称 为 裙 积 


器 或 阵列 处 理 机 )， 大 大 提升 了 禄 


积 等 运算 效率 ， 可 以 进行 二 维 受 后 地 震 成 像 ，20 世纪 80 


年 代 的 向 量 处 理 机 ， 可 以 实现 二 维 受 前 地 震 成 像 ， 能 够 处 理 
E 闭 后 地 震 成 像 ， 开 始 试 用 三 维 准 前 地 震 偏 移 ， 进 入 21 世纪 ， 利 


规模 并 行 机 ， 能 够 实现 三 允 


维 数据 ; 20 世纪 90 年 代 的 大 


用 机 群 计算 机 能 够 实现 三 台 


才 死 希 霍 夫 磊 前 时 间 偏 移 。 未 来 随 计 算 机 性 能 提升 ,三维 波动 方程 


偏 移 、 全 波动 方程 偏 移 、 多 分 量 成 像 技 术 将 得 到 广泛 的 应 月 


测 精 度 ， 每 个 陆 上 地 震 探 区 


1 80 年 代 的 儿 百 炮 发 展 到 今天 的 几 万 炮 至 儿 十 万 炮 。 每 炮 部 署 


儿 百 到 几 千 个 检 波 器 , 每 个 检 波 器 每 炮 采 集 大 约 3000~6000 个 数字 化 样 点 。 这 就 是 说 陆 上 探 
区 要 产生 若干 GB 至 若干 TB 数据 。 海洋 探 区 产生 的 数据 量 更 多 ， 可 以 达到 几 十 TB 至 几 百 


TB 数据 。 
6.2.2 油气 高 性 能 应 用 软件 


pal 


。 在 数据 规模 方面 ， 为 了 提高 巴 


根据 地 震 探测 中 计算 任务 划分 ， 高 性 能 应 用 软件 分 为 三 种 : 地 震 数据 处 理 、 油 藏 数值 模 
拟 和 计算 可 视 化 。 其 中 地 震 数据 处 理 对 计算 能 力 的 需求 最 高 。 如 表 6 所 示 ， 目 前 中 国 石油 行 
业主 要 使 用 国外 的 商业 软件 ， 也 采用 一 些 国 内 自主 开发 的 软件 包 。 

目前 中 国 石油 行业 应 用 的 商用 地 震 表 6. 目前 油气 高 性 能 计算 应 用 软件 
资料 处 理 软件 主要 来 自 国外 厂商 ， 有 ” ”种 类 应 用 软件 供应 商 
Paradigm 的 Geodepth 和 Focus、Western 地 震 资料 处 理 “ProMax， SeisSpace Landmark 
Geco 的 Omega、CGG 的 GeoCluster。 Geodepth, Focus Paradigm 


这 些 应 用 均 为 机 群 并 行 版 本 。 


自主 开发 的 这 类 软件 有 BGP 开发 的 
GeoEast、 中 国 石 化 南京 石油 物探 研究 


所 


开发 的 iCluster， 采 用 PSTM 闭 前 时 
间 偏 移 和 PSDM 车 前 深度 偏 移 的 算法 。 


应 用 软件 计算 精度 和 复杂 度 仍 在 不 断 


增长 。 


国内 的 BGP 等 企业 也 开始 尝 


国外 主要 厂商 WesternGeco 等 已 
开始 将 RTM 逆 时 偏 移 等 消耗 CPU 
更 多 、 精 度 更 高 的 偏 移 算 法 投入 生产 。 


试 Para- 


digm 公司 的 CRAM 共 反 射 角 偏 移 模块 。 


油 藏 模拟 类 的 应 用 软件 有 Landmark 的 VIP/Nexus 和 Schlumberger 的 Eclipse。 国 内 自主 


开发 的 相关 产品 主要 有 大 庆 丰 


究 院 的 PRBS 并 行 黑 油 模拟 。 


6.2.3 油气 应 用 计算 的 需求 特征 


地 震 资料 处 理 以 求解 数据 密集 的 波动 方程 为 主要 计算 模式 , 是 典型 的 浮 点 计算 密集 型 应 
用 ,对 计算 能 力 的 增长 有 持续 的 需求 。 下 图 给 出 了 各 种 地 震 资料 处 理 算法 对 计算 能 力 和 存储 


空间 的 需求 。 
发 


图 5 中 以 当前 广泛 采用 的 死 希 霍 夫 时 间 人 4 
展 到 逆 时 偏 移 对 计算 能 力 需求 是 


局 移 对 计算 能 


目前 国内 Omega Western Geco 
Geocluster CGG 
GeoEast BP 
油 藏 摸 拟 VIP/ Nexus Landmark 
Eclipse/ Intersect Schlumberger 
RMS Roxar 
计算 可 视 化 Geoprobe Landmark 
资源 Petrel Shlumberger 
VoxelGeo, GoCad Paradigm 


和 存储 的 需求 为 单位 1， 


全 波形 反 演算 法 对 计算 能 力 需 求 是 


前 的 1000 倍 , 存储 容量 扩大 到 晶 


前 的 10 倍 , 而 理想 的 


目前 地 震 资 料 处 理 


目前 的 工 百 万 倍 ， 容 量 仅 需 要 提升 为 
应 用 最 大 的 并 行 度 能 够 达到 1000 节点 以 上 ， 国 内 能 达到 的 


不 高 , 在 100~200 节点 之 间 。 限 制 扩展 性 的 主要 问题 之 一 是 广播 通信 瓶颈 


前 的 20 倍 。 


行 度 并 
增 大 ， 


， 当 节 反 数目 


广播 开销 呈 线 性 增长 。 由 于 算法 的 限制 ， 计 算 能 力 的 提高 很 难 通过 无 限 增 大 节点 数目 实现 。 
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能 力 实现 。 


前 的 主要 方法 还 是 采用 提高 单 节点 计算 
容量 ， 内 存 带宽 的 占用 中 等 ,但 需要 
较 高 的 本 地 IO 带宽 ， 这 主要 是 由 于 
数据 集 较 大 , 无 法 完全 放 入 内 存 处 
理 。 


水 104 

油 藏 模拟 主要 是 使 用 稀疏 矩阵 i 
方程 的 迭代 求解 ,对 内 存 带宽 的 要 求 SG ， 
非常 高 ， 并 需要 大 缓存 支持 ,可 归 为 “ 师 人 
对 内 存 带 宽 高 度 敏感 的 计算 密集 应 10 


KPrSDM (TTD 
克 希 霍 夫 村 前 深度 偏 移 
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此 外 , 地 震 数据 处 理 不 需要 太 多 的 内 存 


FWI-Elastic 
全 波形 反 演 


The Holy Grail 
圣杯 


Reverse Time 
逆 时 偏 移 


DW-WEM 

OO 向 下 延 拓 波动 方程 偏 移 
Shot WEM (VTD 
地 域 波动 方程 偏 移 


用 。 中国 石油 用 户 期 待 针 对 这 些 需 求 1| Okersmw 类 位 外 动 方 和 信和 
特征 能 开发 出 更 高 效 的 高 性 能 计算 Re 
成 像 复杂 性 
图 5， 地 震 成 像 算法 相对 性 能 需求 


6.2.4 影响 油气 勘探 高 性 能 计算 应 用 的 新 技术 


新 型 体系 结构 处 理 器 
- 通用 GPU(GPGPU)。 根据 报道 
实现 了 8 到 16 倍 的 加 速 。 


证- 列 


新 的 向 量 处 理 部 件 和 新 
个 SPU《〈 协 同 处 理 器 ) 高 速 计算 核 组 成 。 
正在 探索 如 何 利用 这 些 处 


基于 现场 可 编程 门 阵 列 的 加 


十 多 倍 。 例 如 ， 德 克 萨 斯 A&M 大 学 开 
加 速 器 ”) 在 单一 现场 可 编程 门 阵列 中 


发 


异 构 众 核 处 理 器 架构 。Intel Larrabee 基于 IA 架构 ， 扩 展 了 新 的 


里 器 进行 逆 时 偏 移 的 计算 。 

速 计算 。 把 3D PSTM (三 维 倒 前 克 希 霍 夫 时 间 人 1 
中 最 费时 的 核心 部 分 编 成 现场 可 编程 门 阵列 的 协 处 理 
的 SPACE (“ 具 有 重 配置 引 
成 全 流水 线 并 行 模块 ， 克 希 霍 夫 求 和 能 比 


,对 于 频率 域 有 限 差分 算法 核心 , 用 GPU 相对 CPU 


站 令 系 统 ， 增 加 了 


的 高 速 绥 存 。IBM Cell 处 理 器 由 1 个 通用 PowerPC 核 和 8 


它们 的 峰值 性 能 十 分 吸引 人 人， 研究 人 员 


ij 移 ) 
序 , 可 提高 地 震 成 像 效 率 
擎 的 地 震 处 理 


器 程 


Pentium4 (2.4GHz) 快 15 倍 。 地 震 处 理 ， 


二 
HH 


大 量 采用 的 快速 传 里 叶 变 换 、 补 积 


共 方 位 角 偏 移 、 夹 方位 角 偏 移 、 弹 


基于 向 下 延 拓 的 1 


i 移 处 理 和 逆 时 偏 移 等 


后/ 声波 正 


演 建 模 、 


获得 8 倍加 速 
基于 现场 可 编 
偏 移 。 


并 行文 件 系统 


,3s 逆 
程 门 


时 偏 移 3-D 裙 积 步 获得 
阵列 的 超级 计算 机 Cray 


2D/3D SRME、 波 形 反 演 和 波动 方程 偏 移 速 度 分 析 等 ， 也 适合 用 
程 门 阵 列 加 速 。 例如， 斯 坦 福 大 学 SEP 小 组 的 研究 结果 表明 ， 向 下 延 拓 偏 移 FK 步 


现场 可 编 


5-8 倍加 速 。 津 波 〈Tsunami) 声称 利用 
XD1， 已 经 能 够 有 效 进行 逆 时 波动 方程 


地 球 物理 应 用 既是 计算 密集 型 ， 又 是 数据 密集 型 。 机 群 具有 高 的 性 能 价格 比 , 但 是 


也 受 限 于 输入 输出 和 节点 间 通 讯 能 力 。 地 球 物 


Ll 


里 程 月 


己 经 采取 一 些 有 效 的 优化 措施 ， 


Ua 


例如 ， 采 用 大 块 通讯 减少 启动 次 数 ， 优 化 


区 域 分 解 减少 要 传送 的 数据 量 等 。 采 用 并 行文 


件 系 统 ， 以 及 利用 IO 线程 与 计算 线程 3 
用 的 基于 NFS 文件 系统 的 
使 用 并 行文 件 系统 提升 VO 性 能 ， 例 如 Lustre、 


左 和 全 


水 ”技术 。 当 计算 线程 处 理 
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行 执行 
享 IO 技术 已 经 不 能 够 满足 需 


， 提 升 系统 输入 输出 性 能 。 目 前 机 群 采 
求 ， 地 震 数据 处 理 开 始 探索 


PVFS2、Panasas ActiveScale。 减 少 输 入 


输出 开销 的 行 之 有 效 的 一 种 技术 利用 独立 的 输入 输出 线程 与 计算 线程 并 发 执行 的 “ 软 流 
上 :一 段 输入 的 数据 时 候 ， 输 入 线程 输入 新 数据 ， 而 输出 线程 


中 国 


性 能 计算 研究 与 应 用 调查 报告 


型 


输出 已 经 完成 计算 的 数据 。 
@ 计算 模式 


20 世纪 70 年 代 ， 以 IBM 为 代表 的 计算 机 厂商 ， 曾 经 推动 了 地 震 数 据 批量 处 理 技 
术 变 革 。20 世纪 90 年 代 ， 以 微软 为 代表 个 人 计算 机 应 用 技术 ， 曾 经 推动 了 地 震 数据 处 
理 人 机 交互 界面 技术 变革 。 今天， 以 谷歌 (Google) 为 代表 的 海量 数据 处 理 技术 ， 是 和 否 
会 推动 地 震 数据 并 行 处 理 技术 的 变革 ? 中国 的 石油 用 户 需 要 这 样 的 网 络 化 地 震 数据 并 
行 计算 平台 ， 这 个 平台 需要 具有 以 下 特性 : 


能 够 利用 大 于 1 Pflops 的 超级 机 群 ; 

一 ”能 够 利用 网 格 计算 技术 形成 资源 共享 环境 ; 
能 够 支持 新 型 计算 节点 ， 比 如 每 个 节点 20 或 更 多 的 混合 的 CPU+GPU 核 ， 具 有 专 

门 加 速 器 ; 

一 能够 提供 海量 分 布 式 存储 和 并 行 数据 存 取 能 

一 ”基于 这 样 的 并 行 计算 平台 开发 的 新 一 代 石 油 应 用 软件 ， 需 要 具备 以 下 功能 


一 * ”提供 并 行 应 用 程序 的 控制 框架 ; 
忆 * ”提供 高 性 能 的 数据 并 行 访问 接口 和 通信 接口 ; 

GAN * 支持 地 震 数据 并 行 应 用 程序 的 快速 开发 

A * ”能 同时 用 于 地 震 数 据 处 理 过 程 和 地 震 数 据 解释 过 程 。 

人 

© 6.3 气象 领域 的 应 用 

CO 

3 数值 天 气 预 报 就 是 通过 求解 流体 力学 、 热 力学 微分 方程 组 来 描述 大 气 运动 规律 。 通过 对 
~ 该 方程 组 的 求解 以 获得 最 高 气温 、 最 低 气 温 、 降 水 量 、 湿 度 、 气 压 、 风 向 和 风速 7 个 未 知 量 
OO 的 时 空 分 析 , 来 预测 未 来 一 段 时 间 内 的 大 气 运 动 状 态 和 天 气 现象 。 由 于 数值 天 气 预报 所 需 的 
AN 计算 量 非 常 大 ， 并 且 计 算 的 实时 性 要 求 高 ， 必 须 利 用 高 性 能 计算 。 


数值 天 气 预 报 开 始 于 20 世纪 20 年 代 , 由 英国 数学 家 理 查 德 森 (Richardson ) 提出 。1950 
年 ， 查 尼 〈Charney) 等 人 首次 利用 电子 计算 机 ENIAC 进行 数值 预报 。 今天 ， 数 值 预报 已 经 
成 为 天 气 预 报 的 基础 。 数 值 天 气 预 报 也 是 高 性 能 计算 的 一 个 传统 领域 。 


< 虽然 高 性 能 计算 系统 的 性 能 不 断 提 升 , 对 天 和 气 预 报 质量 的 需求 一 更 高 频 度 的 天 气 了 预报 
9 和 更 精确 的 范围 ， 也 在 不 断 提 高 。 例 如 天 气 预 报 的 频 度 从 每 天 一 次 增加 到 三 小 时 预报 一 次 ， 


+t 至 需要 实时 预报 。 天 气 预报 的 分 辨 率 从 1 千 米 缩小 到 100 米 ， 在 某 些 情况 甚至 是 20 米 。 
随 着 高 质量 数值 天 气 预 报 需求 的 增长 ， 中 国 计 划 将 高 性 能 计算 作为 全 国 性 的 基础 设施 建设 。 
中 国 将 要 建立 大 量 的 地 方 超级 计算 中 心 ， 安 装 计 算 能 力 为 10~50TFlops 的 超级 计算 机 。 


6.3.1 数值 天 气 预 报 


中 国 数值 天 气 预报 的 发 展 历史 可 追溯 到 1955 年 。 从 1969 年 国家 气象 局 正式 发 布 短 期 数 
值 天 气 预报 起 ， 数 值 预 报 模 式 得 以 逐步 改进 。1982 年 ， 中 国 第 一 个 数值 预报 业务 系统 
短期 数值 天 气 预报 业务 系统 (简称 B 模式 ) 在 中 型 计算 机 上 建立 并 正式 投入 业务 应 用 。1991 
年 ， 中 国 第 一 个 中 期 数值 预报 业务 系统 (简称 T42) 在 CYBER 大 型 计算 机 上 建立 并 正式 投 
入 业务 运行 。2002 年 9 月 ， 建 立 了 全 球 T213L31 全 球 中 期 分 析 预 报 系统 (简称 T213)， 预 
报 水 平 有 了 质 的 飞跃 。 中 国 自主 研发 的 应 用 软件 全 球 同化 与 中 期 数值 预报 系统 简称 
GRAPES )， 成 为 中 国 新 一 代 的 中 期 数值 预报 业务 系统 的 基础 。2009 年 ， 中 国 气 象 局 | 
T213L31、Grapes_Meso、 全 球台 风 路 径 数 值 预报 、T106L19 中 期 集合 预报 和 NMC 中 尺度 数 
值 预报 系统 构成 NWP 基本 业务 体系 。 在 气候 模式 系统 方面 ， 中 国 也 建立 起 了 由 大 气 环流 模 
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式 、 海 洋 环流 模式 及 其 耦合 的 海 气 耦 合 模式 、 区 域 气候 模式 组 成 的 气候 动力 模式 系统 ， 能 够 
制作 季节 和 年 度 气候 预测 。 


6.3.2 气象 应 用 中 高 性 能 计算 的 挑战 


随 着 经 济 和 社会 的 发 展 ， 人 们 对 气象 服务 质量 的 要 求 也 越 来 越 高 , 尤其 是 一 些 重大 社会 
活动 对 气象 预报 的 精度 和 时 效 提出 了 极 高 的 甚至 苛刻 的 要 求 。 以 2008 年 北京 第 29 届 奥 林 匹 
克 运 动 会 为 例 , 气象 因素 往往 会 对 体育 赛事 产生 关键 的 影响 ， 例 如 风 会 对 田径 、 射 箭 等 比赛 
产生 影响 ， 高 温 湿 热 会 对 马术 比赛 造成 影响 , 各 专项 体育 比赛 对 天 气 预报 都 有 很 高 的 技术 要 
求 。 气象 部 门 需 要 在 天 气 复杂 多 变 的 主 汛期 ， 提 供 每 3 小 时 预报 的 高 精细 化 服务 ， 预 报 落 点 
要 精确 到 每 个 场馆 。 为 了 做 好 北京 奥运 会 气象 保障 工作 ， 北 京 市 气象 局 采用 了 峰值 性 能 为 
9.8TFlops 的 IBM Cluster 1600 机 群 和 电光 4000A 高 性 能 计算 机 双 机 互 为 备份 系统 运行 奥运 
会 期 间 的 数值 天 气 预 报 业 务 。 与 2008 年 北京 奥运 会 的 气象 保障 工作 相 比 ，2010 年 上 海 世界 
博览 会 的 气象 保障 工作 更 加 艰巨 。 与 北京 奥运 会 相 比 ， 上 海 世博 会 的 时 间 跨 度 长 ， 且 正 值 汛 
期 等 灾害 性 天 气 多 发 的 时 期 。 另 外 ， 世 博 会 展 馆 多 为 临时 建筑 ， 大 量 应 用 新 型 建材 ， 其 防御 
气象 灾害 能 力 的 不 确定 性 有 所 增加 , 易 造 成 次 生 灾 害 。 这 些 都 对 上 海 世博 会 的 气象 保障 提出 


~ 了 更 高 的 要 求 ， 要 求 曙光 5000A 为 上 海 世博 会 提供 优质 的 气象 计算 服务 。 

QN 数值 天 气 预 报 经 常会 受到 可 用 计算 能 力 的 限制 。 如 果 将 三 维 空间 分 辨 率 提 高 两 倍 ,时间 
CN 步 长 缩短 为 原来 的 一 半 ， 需 要 的 计算 能 力 将 提高 16 倍 ， 精 确 度 不 断 提高 的 预测 也 使 得 计算 
已 量 不 断 增加 。 目 前 中 国 气象 用 户 面 对 的 更 突出 的 问题 是 大 规模 并 行 数值 预报 软件 的 可 扩展 性 
cm 较 差 ， 并 行规 模 一 般 仅 在 128-256 个 处 理 器 核 左 右 。 

区 6.4 工程 仿真 应 用 


中 国 的 工程 仿真 应 用 起 始 于 航天 工业 , 与 发 达 国家 的 起 步 时 间 大 致 相同 ,而 其 应 用 领域 
却 长 期 间 于 航天 工业 、 国 防 相 关机 构 和 一 些 研究 所 。 近 些 年 产品 生命 周期 管理 技术 获得 了 各 
级 政府 的 支持 , 同时 中 国 广 商 在 全 球 经 济 危 机 中 面临 严峻 压力 , 希望 将 工程 仿真 作为 关键 技 
术 来 改善 产品 和 增进 创新 。 近 来, 工程 仿真 在 汽车 、 船 舶 、 机 械 和 电子 工业 等 领域 得 以 发 展 。 


工程 仿真 既 可 以 运行 在 超级 计算 机 ,也 可 以 运行 在 各 种 小 型 计算 系统 和 工作 站 上 。 随 着 
硬件 成 本 的 降低 ， 高 性 能 计算 在 中 国 工 业 和 制造 业 上 广泛 应 用 。 中 小 规模 的 制造 商 通常 使 用 
公共 超级 计算 中 心 的 资源 ， 如 上 海 超 算 中 心 。 然而 中 国 工程 仿真 软件 市 场 主 要 由 国外 厂商 开 
发 ,一 部 分 自主 开发 的 系统 虽然 尽力 商业 化 , 却 少 有 成 功 。 大 多 数 原 因 是 由 于 缺少 市 场 需求 ， 
而 且 点 对 点 服务 支持 也 比较 薄弱 。 

6.4.1 汽车 设计 

汽车 碰撞 试验 在 中 国 汽车 工业 广泛 使 用 。 汽 车 碰撞 试验 的 主要 领域 包括 非 线 性 动力 学 仿 
真 、 疫 劳 耐 久 性 分 析 、 汽 车 外 流 场 数值 模拟 、 磁 撞 仿 真 。 整 车 振动 仿真 和 舒适 性 评价 等 方面 
对 于 整 车 设计 也 发 挥 着 重要 作用 。 基 于 高 性 能 计算 系统 的 碰撞 仿真 数值 模拟 越 来 越 被 广泛 采 
用 。 


磁 撞 仿真 着 重 于 模拟 车 辆 的 安全 性 和 辜 撞 时 对 乘员 的 保护 , 模拟 操作 可 以 由 计算 机 迅速 
完成 并 且 花 费 较 低 。 厂商 有 机 会 在 车 辆 投产 前 对 设计 进行 进一步 优化 。 例如 国内 厂商 比亚迪 
《简称 BYD) 的 碰撞 模拟 着 重 在 磁 撞 历程 仿真 和 与 其 他 车 辆 相 撞 时 乘员 的 受伤 情况 ， 其 中 
后 者 是 不 能 在 现实 生活 中 测试 的 。 人 碰撞 仿真 利用 有 限 元 技术 求解 复杂 问题 。 该 过 程 目前 使 用 
上 海 超 级 计算 中 心 的 32 个 CPU 和 商用 软件 进行 仿真 需要 4 人 至 5 个 小 时 。 中国 汽 车 企业 应 用 
高 性 能 计算 机 的 主要 动因 是 : 开发 一 辆 新 车 通常 需要 36 个 月 和 100 辆 汽车 碰撞 试验 用 样 车 ， 
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采用 模拟 计算 之 后 , 只 需要 14 个 月 和 少 于 10 辆 碰撞 用 样 车 , 大 大 缩短 了 时 间 , 降低 了 成 本 。 
汽车 碰撞 试验 着 重 在 倍 撞 时 乘员 约束 系统 对 乘员 的 保护 、 碰 撞 过 程 仿 真 和 车 吴 安 全 性 评价 等 
方面 。 当 前 碰撞 过 程 仿真 主要 是 模拟 速度 为 80km 的 汽车 发 生 磁 撞 时 在 时 间 长 度 为 120ms 
的 过 程 ， 约 有 100 万 个 有 限 单元 。 


中 国 汽车 制造 商 三 强 之 上 汽 集团 为 了 更 方便 快捷 地 使 用 高 性 能 计算 资源 , 铺设 了 
与 上 海 超 算 中 心 的 网 络 专 线 ， 并 购置 了 两 台 总 共 近 500 个 CPU 的 高 性 能 计算 机 。 上 汽 集团 
第 一 辆 自 有 品牌 Roewe 750 就 是 在 这 些 高 性 能 计算 平台 开发 的 。 


奇瑞 是 国内 为 数 不 多 的 拥有 研发 能 力 并 在 车 身 、 引 擎 和 汽车 零 部 件 上 拥有 自主 技术 的 汽 
车 生产 厂家 。 当 前 奇瑞 自称 拥有 国内 汽车 工业 最 大 的 计算 机 辅助 设计 部 门 , 并 且 把 计算 机 辅 
助 设计 应 用 到 整个 研发 过 程 。 奇 瑞 还 独立 开发 了 一 些 针 对 自身 产品 的 计算 机 辅助 设计 软件 
包 ， 如 车 辆 怠速 时 的 性 能 分 析 、 在 任意 路 面 的 车 辆 行驶 舒适 度 分 析 、 数 字 虚 拟 原 型 动态 分 析 
的 模拟 平台 (INTEDYNA/MCHERY) 和 多 种 用 途 的 显示 有 限 元 程序 (C-SAFE)。 奇 瑞 的 新 车 型 A3 
轿车 ， 在 设计 过 程 中 与 上 海 超 算 中 心 合作 ， 成 功 通 过 C-NCAP 碰撞 ， 荣 获 C-NCAP 五 星 安 


全 评定 。 

Ee 6.4.2 飞机 设计 

CN 飞机 制造 业 是 中 国 工程 仿真 的 发 源 地 , 从 工业 的 视角 来 看 , 代表 了 工程 仿真 的 综合 需求 。 
SS 随 着 计算 机 辅助 设计 在 中 国 制造 业 的 普及 ,飞机 制造 业 中 的 工程 仿真 已 经 高 度 成 熟 。 其 中 飞 
em, 行 器 的 计算 结构 力学 、 流体 力学 、 材 料 力学 和 电磁 模拟 技术 是 高 级 飞行 器 设计 与 制造 的 核心 
CD 技术 。 此 领域 中 主要 的 计算 机 辅助 设计 包括 :整个 飞行 器 设计 、 气 动 设计 、 结 构 强度 分 析 、 
区 飞行 控制 、 燃 料 系 统 和 着 陆 装置 设计 。 其 中 用 到 系统 级 协同 仿真 平台 、 多 学 科 仿 真 和 仿真 过 
和 程控 制 。 然 而 目前 可 用 的 商用 软件 包 尚 有 一 些 关键 的 航空 问题 不 能 解决 。 飞 机 制造 业 还 需要 
Co 依赖 自身 的 能 力 独 立 开发 需要 的 软件 。 传 统 的 飞机 设计 模式 是 将 升力 、 推 力 、 平衡 、 航 向 稳 
a 定 和 控制 等 功能 指定 于 相应 部 件 ， 由 不 同 的 项 目 组 独立 开发 不 同 的 模块 , 需要 花费 大 量 的 时 

间 进 行 协调 。 此 外 ， 还 要 进行 大 量 的 风 洞 试 验 ， 开 发 周期 长 、 成 本 高 。 


Cy 


中 国 的 飞机 制造 业 在 1970 年 代 末 开始 尝试 发 展 数 字 化 工程 ， 并 且 在 一 些 重点 型 号 飞机 
= 的 研究 中 加 以 应 用 。 实 现 数字 化 后 ,在 设计 阶段 ， 数 字样 机 取代 实物 样机 ， 数 字 化 风 洞 试验 


取代 90% 以 上 的 气动 选 型 试验 ，CAE 仿真 减少 60% 以 上 的 零 部 件 强度 试验 和 所 有 全 机 静 力 
9 试验 ， 可 以 实现 快速 的 多 学 科 、 多 目标 优化 ， 设 计 出 最 佳 方案 。 


计算 空气 动力 学 CCFD) 是 流体 力学 的 一 个 分 支 ， 使 用 数值 方法 分 析 并 求解 流体 问题 。 
在 飞机 研制 过 程 中 ， 从 设计 要 求 确 定 、 概 念 初步 设计 ， 到 详细 计算 、 原 型 机 试制 、 试 飞 以 及 
设计 定型 , 处 处 需要 气动 分 析 。 除 单个 部 件 的 气动 计算 外 , 还 需要 分 析 部 件 之 间 的 融合 设计 。 
ARJ21-700 飞机 是 中 国 商用 飞机 公司 上 海 飞 机 设计 研究 所 与 上 海 超 级 计算 中 心 紧密 合作 自 
行 研 制 的 首 架 中 短途 商用 文 线 喷气 式 飞机 。 作 为 ARJ21 的 研发 主体 ， 上 海 飞 机 设计 研究 所 
通过 ARJ21 项 目 使 用 超过 100 万 CPU 小 时 用 于 CFD 计算 分 析 。 


上 海 飞 机 设计 研究 所 和 上 海 超 级 计算 中 心 还 合作 开展 了 大 型 客机 的 研发 。 上 曙光 5000A 
用 于 进行 大 飞机 高 低速 机 辟 设 计 、 大 飞机 辟 身 组 合体 设计 、 发 动机 山 挂 设计 等 。 计 算 流体 力 
学 还 将 用 于 解决 大 型 客机 研制 中 的 各 个 方面 问题 , 包括 气动 布局 研究 、 部 件 优化 设计 、 全 流 
场 分 析 、 动 力 影响 计算 、 结 冰 计 算 分 析 、 气 动 噪音 分 析 、 环 境 温度 分 析 等 。 
6.4.3 船舶 设计 


P 国 是 世界 上 排名 第 三 的 造船 大 国 ， 出 口 市 场 志 及 世界 60 多 个 国家 和 地 区 。 在 船舶 设 


i 
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计 中 ， 船 体外 部 流 场 分 析 及 阻力 计算 、 螺 旋 桨 空 泡 模拟 、 复 杂 舱 室 的 换 热 分 析 、 发 动机 流 场 
模拟 、 海 水 与 空气 的 液 面 运动 分 析 、 船 体 结 构 的 鲁 棒 性 设计 、 船 舶 碰撞 分 析 等 ， 都 需要 高 性 
能 计算 。 


中 国 造船 总 公司 下 属 的 中 国 船 舶 及 海洋 工程 设计 研究 院 是 中 国 船舶 和 海上 建筑 研究 、 开 
发 、 设 计 和 工程 方面 规模 最 大 并 且 综 合 性 最 强 的 机 构 。 中 国 船舶 及 海洋 工程 设计 研究 院 模型 
优化 技术 的 发 展 经 历 了 三 个 阶段 。 早 期 的 模型 试验 阶段 ， 模 型 的 制造 时 间 限 制 了 可 供 选择 的 
设计 方案 的 数量 ; 后 来 的 模拟 计算 阶段 , 使 用 小 型 计算 系统 需要 花费 很 长 的 时 间 得 到 最 终结 
果 ; 现在 的 高 性 能 计算 阶段 ， 使 用 上 海 超级 计算 中 心 的 高 性 能 计算 资源 ， 原 来 需要 近 一 个 月 
计算 时 间 的 问题 , 现在 一 到 两 天 就 可 以 得 到 结果 。 然 而 中 国 的 船舶 设计 应 用 的 主要 问题 在 于 
软件 。 目 前 造船 业 受 限于 国外 成 熟 商 用 软件 的 昂贵 价格 。 由 于 软件 许可 的 限制 , 中国 船 舶 及 
海洋 工程 设计 研究 院 在 使 用 上 海 超 算 的 资源 时 一 般 仅仅 使 用 32-64 个 CPU, 应 用 本 映 良 好 的 
并 行 潜力 没有 充分 挖掘 ， 精 度 也 得 不 到 提高 。 


6.4.4 机 械 和 电子 设计 


— 计算 机 辅助 工程 分 析 在 国内 机 械 制 造 业 的 使 用 尚 处 于 发 展 阶段 。 主 要 的 领域 包括 : 静态 
机 械 分 析 / 动 态 仿真 分 析 、 模 态 分 析 、 压 力 和 形变 分 析 、 动 态 特 征 的 仿真 分 析 、 稳 定性 仿真 
CN 分 析 、 届 有 曲 仿真 分 析 、 疲 劳 仿真 分 析 、 部 件 干扰 检测 和 虚拟 数字 样机 。 

AM 

© 电子 工业 中 计算 机 辅助 工程 分 析 的 应 用 情况 各 个 公司 不 尽 相 同 , 但 总 体 上 看 处 于 发 展 阶 
© 段 。 一 些 制造 商 可 以 有 效 使 用 计算 机 辅助 技术 ， 在 不 同 设计 者 之 间 开 发 标准 的 工作 流 。 一些 
CO 公司 将 计算 机 辅助 工程 分 析 (CAE) 集成 到 产品 整体 生产 流程 中 。 然 而 。 大 部 分 厂商 只 是 最 
区 近 在 产品 发 展 中 引进 CAE 工具 , 仍 需 时 间 来 改善 使 用 技能 。 电 子 工业 中 CAE 的 使 用 领域 包 
一 括 : 产品 可 靠 性 、 切 削 加 工 性 、 疲 劳 寿命 、 冲 击 阻 力 、 矢 量 振动 和 电子 元 件 振动 的 耦合 、 适 
Co 配器 设计 、 热 分 机、 电子 忌 片 组 装 、 焊 接点 的 疲劳 分 析 、 振 动 与 噪声 分 析 、 传 输 包 装 中 跌落 
仿真 分 析 、 控 制 系统 和 机 械 系 统 的 耘 合 分 析 。 格兰仕 是 国内 , 甚至 世界 最 大 的 微波 炉 生 厂商 ， 


与 中 国 科 学 院 深 圳 先进 技术 研究 院 合作 利 用 高 性 能 计算 系统 设计 和 仿真 微波 炉 封装 , 优化 的 
设计 每 年 为 公司 节省 约 1 千 万 元 《150 万 美元 )。 另 外 ， 一 些 大 三 商 也 对 多 种 物理 场 耦 合 仿 
真 和 产品 动态 工作 环境 进行 了 高 性 能 计算 优化 。 


二 6.5 互联 网 应 用 


网 络 应 用 可 以 划分 为 信息 获取 、 交 流 沟通 、 网 络 娱乐 、 商 务 交 易 四 种 类 型 ， 基 本 涵盖 了 
目前 的 网 络 新 闻 、 搜 索引 擎 、 即 时 通信 、 博 客 、 网 络 游戏 、 网 络 音乐 、 网 络 购物 、 网 上 支付 、 
网 络 金融 等 各 种 具体 应 用 。 


6.5.1 中 国 互联 网 应 用 的 历史 


1999 年 至 2002 年 ， 中 国 互 联网 应 用 如 网 上 教育 、 网 上 银行 、 电 子 商务 、 第 四 媒体 出 现 
并 快速 发 展 起 来 。1999 年 8 月 ， 在 全 国 高 等 学 校 招生 工作 中 ， 六 个 省 、 市 的 二 百 余 所 高 校 
使 用 “全 国 高 校 招生 系统 ”在 CERNET 上 进行 了 第 一 次 网 络 招生 。1999 年 9 月 ， 招 商 银行 
率先 在 国内 全 面 启动 “一 网 通 ” 网 上 银行 服务 ， 成 为 国内 首先 实现 全 国 开 通 “ 网 上 银行 ”的 
商业 银行 。1999 年 9 月 6 日， 中 国 国际 电子 商务 应 用 博览 会 在 北京 举行 ， 标 志 着 中 国 全 面 
采用 电子 商务 技术 。2000 年 12 月 12 日 ， 人 民 网 、 新 华 网 、 中 国 网 、 央 视 国 际 网 、 国 际 在 
线 网 、 中 国 日 报 网 、 中 青 网 等 获得 国务 院 新 闻 办 公 室 批准 进行 登载 新 闻 业 务 ， 率 先 成 为 新 闻 
网 站 。2001 年 ， 盛 大 网 络 在 大 陆运 营 韩 国 网 络 游戏 《传奇 》， 成 为 中 国 网 络 游戏 市 场 上 的 第 
一 个 霸主 。 
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从 2003 年 开始 ， 中 国 互联 网 应 用 进入 了 多 元 化 阶段 ， 并 一 步 步 拥有 世界 上 最 大 的 用 户 
群 。 搜 索引 擎 成 为 中 国 网 民 获 取信 息 的 重要 入 口 ， 深 刻 影响 着 网 民 的 网 络 生活 和 现实 生活 。 
二 2009 年 6 用， 国内 人 尼采 户 达到 23 亿 ， 交 玉音 首 达 到 25 亿 ， 电 了 
件 用 户 数量 达 1.8 亿 ， 即 时 通讯 用 户 数 量 达 到 2.4 亿 ， 博 客 的 用 户 数 量 为 1.8 亿 ， 网 上 论 
es ee et ee et 
络 购物 用 户 8 和 干 万 ， 网 上 预订 用 户 1 千 万 ， 网 上 支付 用 户 7 千 万 ， 网 络 炒股 用 户 3 千 万 。 


6.5.2 互联 网 应 用 的 计算 需求 
1. 系统 规模 


te Me de in 
万 的 并 发 访问 , 常常 需要 至 少儿 千 个 节点 的 计算 能 力 。 不 同 的 应 用 业务 经 常 不 共享 底层 的 便 
件 ， 有 各 自 独 立 的 系统 。 


2. ”资源 使 用 特征 


ean 即 数 据 的 移动 、 更 新 操作 ， 各 级 存 
储 系统 的 IO 是 应 用 的 性 能 瓶颈 。 中 国 互 联网 应 用 大 部 分 属于 在 线 服务 业务 ， 需 要 文 持 高 并 
发 访问 ， 保 证 低 延 迟 响应 NI lel 但 这 些 数 据 可 以 被 
很 好 地 划分 到 不 同 节点 上 ， 并 且 有 高 效 的 索引 支持 ， 单 个 访问 请 求 的 1O 量 并 不 大 。 多 级 的 
缓存 机 制 可 以 缓存 住 很 大 部 分 访问 ， 因 此 用 到 的 物理 磁盘 读 写 较 少 。 


政府 的 互联 网 应 用 大 多 属于 离线 分 析 业 务 ， 主 要 是 数据 索引 、 数 据 分 析 、 数 据 挖掘 ， 并 
发 度 不 高 ， 但 单个 任务 涉及 的 数据 量 巨大 、 执 行 时 间 长 ， 磁 盘 读 写 是 性 能 瓶颈 。 


3. ”软件 


在 线 实时 类 应 用 的 数据 和 访问 特征 通常 可 以 很 好 地 抽象 为 键 值 (key-value) 模型 。 数 据 
库 可 以 支持 这 种 数据 模型 , 但 互联 网 应 用 的 数据 访问 方式 相对 简单 且 数 据 规模 巨大 。 服 务 商 
通常 对 开源 数据 库 进 行 裁剪 , 或 者 在 文件 系统 之 上 开发 新 的 针对 这 一 模型 的 结构 化 数据 管理 
软件 。 离 线 的 数据 分 析 类 应 用 ， 多 使 用 开源 的 Hadoop 软件 。 


6.5.3 网 络 游戏 公司 


盛大 目前 是 中 国 最 大 的 网 络 娱乐 公司 ， 主 要 业务 包括 盛大 游戏 、 盛 大 在 线 、 盛 大 文学 。 
盛大 游戏 是 核心 业务 ， 其 基础 设施 包括 分 散在 全 国 几 个 地 点 的 约 2-3 万 台 PC 服务 器 ， 划 分 
为 登录 服务 器 、 网 关 服 务 器 、 储 存 游戏 数据 的 游戏 服务 器 、 计 费 服务 器 、 用 户 数据 中 心 等 。 
盛大 网 络 游戏 的 种 类 很 多 , 但 是 大 多 数 的 规模 并 不 大 , 用 户 数 超过 5 万 的 就 属于 比较 成 功 的 
游戏 。 


于 游戏 对 可 靠 性 的 要 求 不 是 太 高 , 游戏 数据 每 天 备份 即 可 , 用 户 数据 则 采用 分 布 式 备 
份 的 方式 。 在 安全 性 方面 , 用 户 数据 中 心 的 要 求 稍 高 一 些 , 做 了 较 多 的 防护 ; 对 于 游戏 服务 ， 
主要 是 在 网 络 层 上 预防 攻击 。 游戏 对 网 络 延 迟 的 要 求 比较 高 , 但 网 络 延 迟 主 要 受 限 于 国内 的 
网 络 环境 , 盛大 仅 能 针对 服务 器 做 少量 优化 。 目 前 主要 性 能 瓶颈 是 磁盘 读 写 和 网 络 包 的 处 理 ， 
但 还 不 严重 ， 通 过 增加 服务 器 的 数量 即 可 解决 问题 。 目 前 游戏 的 开发 主要 使 用 图 形 工作 站 。 
盛大 在 2007 年 开发 了 虚拟 化 方面 的 产品 ,已 于 2008 年 应 用 在 服务 器 上 ; 同时 对 云 计算 相关 
技术 有 较 大 的 需求 。 国 产品 牌 的 PC 机 群 系统 在 网 络 游戏 市 场 占 据 很 大 的 市 场 份 额 ， 国 内 企 
业 都 能 提供 定制 的 游戏 服务 器 。 
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6.6 新 兴 应 用 领域 


除了 科学 计算 、 天 气 预 报 、 油 气 开发 等 传统 的 高 性 能 计算 应 用 ,还 存在 着 高 性 能 计算 应 
用 的 新 兴 领 域 ， 如 医学 、 物 流 、 金 融 、 高 级 人 机 交互 (如 虚拟 现实 )。 下 面 列 出 三 种 中 国 高 
性 能 计算 应 用 的 非 传统 案例 。 


6.6.1 华 大 基因 : 基因 测序 研究 


基因 测序 是 指 分 析 特 定 DNA 片段 的 碱 基 序列 ， 也 就 是 腺 嗓 叭 (A)、 胸 腺 喀 啶 〈T)、 胞 
喀 啶 〈《C ) 与 乌 味 叭 〈G) 的 排列 方式 。DNA 测序 方法 起 始 于 20 世纪 70 年 代 ， 使 用 基于 2D 
层 析 法 的 “加 减法 ”。 随 着 测序 技术 和 上 自动 分 析 的 发 展 ，DNA 测序 变 得 更 加 容易 并 且 速 度 
也 提升 了 若干 数量 级 ， 大 大 加 速 了 生物 学 研究 进程 。 从 20 世纪 90 年 代 人 至今， 大 规模 基因 研 
究 已 经 完成 了 对 多 种 有 机 体 完 整 测 序 ， 如 和 人类、 细菌 、 酵 母 菌 和 果 晶 。 


华 大 基因 建立 于 1999 年 ， 参 与 了 国际 人 类 基因 组 计划 ， 并 完成 其 中 1% 的 工作 。 以 后 
陆续 参与 了 国际 人 类 HapMap 工程 〈10%)、 超 级 杂交 水 稻 基 因 测 序 、 午 基因 工程 、 中 - 英 鸡 
基因 工程 、 首 个 亚洲 二 倍 体 基 因 工 程 和 SARS 研究 , 建立 了 基于 大 规模 基因 测序 的 技术 平台 ， 
~ 进行 有 效 的 生物 信息 学 分 析 和 创新 性 的 基因 卫生 保健 ,这 使 得 华 大 基因 的 基因 测序 和 分 析 能 
~ 力 位 居 亚 洲 第 一 和 全 球 第 三 。 华 大 基因 于 2001 年 和 2007 年 分 别 在 杭州 和 深圳 建立 了 分 部 。 


基因 测序 所 产生 的 数据 量 巨大 , 在 拥有 新 的 测序 仪 后 , 华 大 基因 每 天 新 增 数 据 量 在 10TB 
左右 ， 整 个 数据 库 的 规模 达到 PB 级 别 。 对 如 此 庞大 的 数据 进行 基因 序列 的 拼接 、 比 对 、 排 
序 、 识 别 和 功能 分 析 ， 需 要 高 性 能 计算 环境 。 基 因 测 序 应 用 的 计算 负载 通常 可 以 均衡 地 划分 
到 各 个 计算 节点 上 , 并 且 计算 单元 之 间 的 通讯 非常 少 。 但 整个 计算 过 程 会 涉及 到 多 次 的 磁盘 
读 写 , 因此 成 为 性 能 瓶颈 。 另 外 ,一 些 应 用 ,如 集合 和 交叉 种 类 定位 ， 需 要 大 量 的 内 存 空 间 ， 
同时 TB 级 甚至 PB 级 的 磁盘 空间 来 存储 数据 和 定位 的 结果 也 是 不 可 缺少 的 。 


华 大 基因 维护 了 三 个 高 性 能 计算 中 心 ， 分 别 位 于 深圳 、 北 京 和 杭州 ， 总 计算 能 力 达到 
52TFlops， 内 存 总 量 为 10.3TB， 磁盘 总 量 达 到 5.1PB。 目 前 ， 华 大 基因 对 计算 能 力 的 需求 是 
200TF。 其 高 性 能 计算 环境 包括 曙光 2000、3000、4000H，SGI O2，Sun E10K，Origin 3800， 
IBM p690 及 自己 开发 的 生物 信息 学 Linux 机 群 〈 简 称 BLCs)。 应 用 软件 大 多 数 是 开放 源码 
软件 ， 也 包括 一 些 自己 开发 的 并 行 软件 。 


9 华 大 基因 计划 将 来 为 个 人 提供 基因 测序 。 目 前 为 个 人 进行 基因 测序 的 成 本 大 概 在 10 万 
美元 /人 ， 随 着 技术 的 发 展 , 不 久 的 将 来 会 实现 1000 美元 /人 的 低 成 本 测序 。 大 众 化 基因 测序 
服务 是 华 大 基因 的 未 来 目标 , 基于 低 成 本 的 高 性 能 计算 与 存储 设备 的 云 计 算 平 台 将 会 成 为 他 
们 新 的 选择 。 


6.6.2 上 海 证 券 交 易 所 : 证 券 指 数 计算 


上 海 证 券 交易 所 是 中 国 目 前 最 大 的 证 券 交 易 机 构 。 上 海 证 券 交 易 所 的 证 券 计 算 包括 前 端 
数据 处 理 、 后 端 交易 处 理 和 证 券 指 数 计算 。 上 海 证 券 交 易 所 用 到 的 高 性 能 计算 系统 大 多 是 
IBM-PC 服务 嚣 机群, 商业 软件 包括 专用 操作 系统 openVMS 和 统计 软件 SARS, 每 年 的 许可 
费用 高 昂 。 前 端 数据 处 理 主要 处 理 私人 投资 者 的 数据 ， 可 以 并 行 化 。 后 端 交 易 系 统 对 性 能 
求 高 ， 订 单 处 理 能 力 的 要 求 为 3 万 笔 / 秒 。 例 如 中 国 建筑 上 市 当天 的 处 理 量 就 为 500 万 笔 ， 
相当 于 2006 东京 交易 所 一 天 的 处 理 量 。 查 询 、 成 员 申 报 、 交 易 的 报 合 等 都 需要 提供 实时 的 
文 持 。 后 端 系统 对 可 靠 性 和 数据 备份 要 求 高 ， 需 要 专用 操作 系统 的 系统 级 备份 和 灾 备 中 心 ， 
如 果 10 分 种 不 能 正常 处 理 业 务 就 必须 报到 国务 院 。 
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证 券 计算 应 用 对 浮 点 计算 能 力 要 求 不 高 , 对 定点 处 理 能 力 要 求 高 。 白 天 主要 是 高 春 叶 量 ， 
对 CPU 和 内 存 要 求 高 ， 晚 上 对 磁盘 处 理 能 力 要 求 高 。 其 中 ， 证 券 指 数 计算 业务 需要 为 100 
多 家 券商 提供 计算 支持 ， 能 够 对 基金 公司 一 到 两 年 历史 数据 进行 处 理 。 指 数 计算 为 CPU 密 
集 型 ， 需 要 使 用 高 性 能 计算 机 ， 还 需要 在 物理 机 层面 提供 隔离 


高 性 能 计算 越 来 越 广泛 地 用 于 处 理 银行 和 安全 数据 。2008 年 全 球 金融 危机 爆发 导致 的 
经 济 低迷 。 这 使 人 们 期 望 高 性 能 计算 将 来 能 像 天 气 预报 一 样 用 于 预测 金融 危机 。 因 此 投资 和 
金融 的 数值 模拟 逐步 成 为 中 国 的 新 热点 应 用 。 


6.6.3 水 晶 石 公司 : 动漫 应 用 


虽然 电影 、 电 视 和 动画 产业 在 其 他 国家 已 经 发 展 了 20 余年 ， 在 中 国 却 是 新 兴 产 业 。 文 
化 工业 最 近 被 中 国 中 央 政 府 选 为 近期 刺激 经 济 发 展 的 支柱 产业 。 随 着 生产 技术 的 提升 , 国内 
团队 逐渐 采用 高 性 能 计算 来 模拟 特效 和 进行 渲染 。 水 晶 石 公司 是 泻 染 应 用 中 的 领先 企业 之 
一 ， 主 要 业务 领域 为 建筑 设计 图 泻 染 、 电 影 动画 、 数 字 城 市 ， 代 表 性 用 户 包括 北京 奥运 会 、 
伦敦 奥运 会 、 电 影 《 赤 壁 》、 动画 片 《福娃 漫游 记 》。 


二 水 晶 石 采用 了 曙光 高 性 能 刀片 机 群 系统 ,软件 主要 为 商业 软件 3Dmax 和 Maya,3Dmax 
和- 有 些 插件 支持 多 核 的 并 行 计算 ， 目 前 还 很 少 采用 GPU 进行 泻 染 计算 。 水 晶 石 公司 使 用 高 性 
汪 能 计算 机 主要 用 来 泻 染 场景 。 泻 染 一 个 1024X1920 大 小 的 电影 和 动画 场景 中 的 图 像 需要 1 
© 个 CPU 小 时 左右 ， 而 泻 染 一 幅 分 辩 率 达到 40000 X30000 的 建筑 设计 宣传 图 ， 在 80 个 核 的 
OO 机 器 上 需要 8 个 小 时 左右 。 北 京 奥 运 会 开幕 式 所 需 的 泻 染 应 用 ,由 于 采用 了 曙光 高 性 能 计算 
0 机 ， 将 以 往 需 要 一 个 月 完成 的 任务 缩短 到 一 个 星期 。 

ls 泻 染 应 用 的 计算 独立 性 高 ， 每 一 幅 图 像 都 可 以 单独 计算 ， 不 需要 相互 通信 ， 即 使 对 于 
OO 40000X30000 的 大 场景 ， 也 可 以 分 块 进行 计算 。 另 外 ， 泻 染 应 用 看 重 图 像 的 质量 。 这 类 应 
CN 用 既 不 是 交互 的 (如 3D) 也 不 是 实时 的 〈 如 在线 游戏 和 虚拟 现实 )。 


7 ”中国 高 性 能 计算 企业 


一 受益 于 新 兴 领 域 应 用 软件 的 扩展 , 中 国 的 高 性 能 计算 市 场 正在 快速 增长 , 并且 这 种 增长 
< 将 会 持续 下 去 。 像 惠普 〈HP) 和 IBM 这 样 的 跨国 公司 占据 了 领导 地 位 ， 但 一 些 本 土 企业 ， 
9 如 蜡 光 、 联 想 、 浪 潮 ， 正 在 努力 增加 它们 的 市 场 份 额 。 中 国 高 性 能 计算 企业 经 过 15 年 的 发 


展 ， 从 无 到 有 ， 在 产品 上 已 经 可 以 和 国际 企业 竞争 ， 在 服务 上 有 一 定 优势 ,在 技术 上 还 有 很 
大 差距 。 中 国企 业 要 在 市 场 占有 量 和 技术 竞争 力 上 再 上 一 个 台阶 ， 面 临 着 十 分 巨大 的 挑战 。 


今天 , 高 性 能 计算 的 使 用 者 不 单 只 希望 购买 到 一 套 系统 , 还 希望 从 供应 商 那 里 得 到 全 面 
的 解决 方案 。 在 这 方面 跨国 公司 相 比 本 土 企业 具 有 更 大 的 优势 ， 因为 前 者 在 复杂 系统 上 具备 
更 丰富 的 解决 方案 开发 经 验 。 而 那些 缺乏 行业 解决 方案 经 验 的 供应 商 将 面 对 更 多 的 挑战 ， 甚 
至 失去 部 分 市 场 份额 本章 将 主要 介绍 国内 几 家 较 大 的 高 性 能 计算 供应 商 和 另外 两 家 较 小 的 
供应 商 。 
7.1 曙光 

曙光 公司 (Dawning， 全 称 瞻 光 信息 产业 有 限 公 司 ) 成立 于 1995 年 ， 由 中 国 科 学 院 计 
算 技术 研究 所 和 其 他 几 家 单位 共同 出 资 。 然 而 不 同 于 其 他 投资 者 的 是 , 中 科 院 计算 所 的 出 资 
中 包含 了 价值 2000 万 人 民 币 的 无 形 资 产 (折合 美元 约 290 万 ), 这 部 分 无 形 资产 来 自 于 其 对 
虹 光 I 号 的 开发 所 形成 的 知识 产权 。 在 过 去 的 十 年 中 ,曙光 已 经 成 长 为 中 国 本 土 高 性 能 计算 
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供应 商 的 领导 者 。 在 国产 品牌 的 高 性 能 计算 机 市 场 , 曙光 高 性 能 计算 机 连续 11 年 居 第 一 位 ， 
拥有 70% 以 上 的 份额 。 而 中 科 院 计算 所 也 成 为 曙 光 公司 的 技术 基地 。 映 光 每 年 将 其 销售 收 
入 的 5% 用 于 研发 投入 ， 并 且 建 立 了 一 个 约 30 人 的 研发 中 心 。 


电光 公司 与 中 科 院 计算 技术 研究 所 为 上 海 超 算 中 心 研制 的 曙光 5000A 在 2008 年 11 月 
公布 的 全 球 最 快 超级 计算 机 排行 榜 上 排名 第 十 , 同时 也 是 前 十 名 中 唯一 来 自 美 国之 外 的 高 性 
能 计算 系统 。 曙 光 5000A 采用 AMD 的 Opteron 1.9GHz 四 核 处 理 器 ， 总 计 拥 有 30720 个 计 
算 核 心 、122.88TB 内 存 ， 通 过 Infiniband 4X DDR 技术 互 连 ， 其 峰值 性 能 达到 233.472 万 亿 
次 ，Linpack 性 能 达到 180.6 万 亿 次 。 目 前 计算 所 与 曙光 公司 正在 联手 开发 千 万 亿 次 的 曙光 
6000 高 性 能 计算 机 。2010 年 六 月 发 布 的 “星云 ”， 是 曙光 6000 的 服务 分 区 ,在 2010 年 六 月 
的 Top500 上 排名 第 二 。 此 外 ， 曙 光 公 司 在 以 下 领域 在 中 国 处 于 领先 位 置 : 


@ ”曙光 公司 自行 开发 了 中 国 首 个 刀片 服务 器 TC2600。 每 个 刀片 节点 在 7U 的 机 箱 内 集成 
了 10 个 基于 AMD CPU 的 4 路 SMP 刀片 或 Intel CPU 的 2 路 SMP 刀片 \ 双 机 群 管理 网 
络 、 双 千 兆 以 太 网 、Infiniband 网 络 、5 十 1 元 余热 插 拔 电源 、3 个 风扇 、10 个 PCIE X8 扩 
展 槽 。2009 年 九 月 在 英特尔 开发 者 论坛 上 发 布 的 TC3600 刀片 系统 是 第 一 个 同时 符合 
wy SSI 标准 和 HPCSC 相关 标准 的 刀片 系统 。 它 具有 基于 PCIe 的 扩展 能 力 、 灵 活 的 
下 = Infiniband/Ethernet 开关 、 系 统管 理 模块 、 电 源 、 磁 盘存 储 等 ; 
C\ @ 上 曙光 公司 推出 的 机 群 管理 软件 GridView， 能 在 网 格 环境 下 集中 管理 多 个 机 群 ， 支 持 远 
程 KVM， 具 有 能 耗 管理 功能 ， 在 中 石油 BGP 的 应 用 案例 中 节约 耗 电 30%; 
@ 为 了 提高 高 性 能 计算 技术 支持 和 服务 水 平 , 建成 了 全 国 性 技术 支持 网 络 和 首席 应 用 工程 
师 团队 ， 并 在 北京 建设 了 高 性 能 计算 用 户 体 验 中 心 。 


7.2 联想 


联想 公司 (Lenovo〉 是 中 国 最 大 的 电脑 供应 商 ， 由 于 其 收购 IBM 个 人 电脑 业务 为 世人 
所 知 ， 自 2001 年 开始 涉足 高 性 能 服务 器 业务 。2002 年 联想 开发 成 功 的 基于 IA 架构 的 深 腾 
1800 高 性 能 计算 集群 是 第 一 个 进入 Top500 排行 版 的 中 国 本 土 超级 计算 机 , 当年 排名 43。2003 
年 ， 联 想 开发 的 基于 64X86 集群 架构 的 深 腾 6800 在 Top500 上 排名 第 14。 为 商业 计算 研制 
的 深 腾 2600 IA64 集群 于 2004 年 发 布 后 被 中 国 的 科学 、 商 业 和 网 格 计算 用 户 所 广泛 采用 。 
联想 开发 的 深 腾 7000 在 2008 年 11 月 的 Top500 上 排名 第 19 位 ， 峰 值 性 能 超过 120TFlps。 
然而 联想 高 性 能 计算 研究 开发 小 组 的 一 些 核心 人 物 最 近 离 开 联想 去 了 北京 航空 航天 大 学 , 虽 
然 他 们 仍然 与 联想 保留 合作 开发 关系 。 


2007 年 , 联想 为 AT&T 威廉 姆 斯 车 队 提 供 了 价值 超过 一 千 万 元 人 民 币 的 8Tflops 机 群 系 
统 ， 用 于 F1 赛车 的 设计 。 这 是 中 国企 业 第 一 次 向 海外 提供 这 样 规 模 的 高 性 能 计算 机 。 联 想 
相信 ， 作 为 一 家 跨国 公司 , 他 们 能 生产 和 提供 这 种 产品 的 能 力 说 明了 中 国 制造 的 高 性 能 计算 
机 能 够 参与 国际 市 场 的 全 球 竞 
7.3 浪潮 

浪潮 公司 前 身 是 山东 电子 设备 三， 生产 计算 机 外 围 设备 和 低频 大 功率 电子 管 。 目 前 其 经 
营 范 围 已 尾 盖 了 个 人 电脑 、 服 务 器 、 税 控 机 、 通 讯 产 品 、 信 息 安 全 、 行 业 应 用 软件 及 软件 乡 
包 、 技术 支持 服务 和 存储 设备 。 浪 潮 是 目前 中 国 最 大 的 服务 器 制造 商 和 服务 器 解决 方案 提供 


en 
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浪潮 的 员工 超过 5000 人 ， 总 部 和 产品 基地 位 于 济南 ， 三 个 市 场 中 心 分 别 位 于 北京 、 上 
海 和 广州 ， 研 发 中 心 位 于 北京 、 上 海 、 济 南 和 青岛 。 公 司 同 时 在 美国 加 州 圣何塞 建立 了 一 个 
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30 人 的 小 型 研发 中 心 。 此 外 在 日 本 、 香 港 、 新 加 坡 都 有 其 海外 研发 部 门 。 浪 潮 同 时 专注 于 
政府 和 教育 行业 ， 并 在 这 些 市 场 上 表现 出 色 。 


浪潮 是 国内 最 早 涉足 服务 器 研发 和 制造 的 供应 商 之 一 。2003 年 公司 提出 了 “灵活 部 署 ” 
(Flexible Deployment) 概念 并 开发 了 相关 技术 和 产品 。 其 天 梭 系 列 的 服务 器 是 高 性 能 计算 
领域 的 关键 产品 。 除 了 建造 系统 外 ， 近 年 浪潮 还 加 强 了 对 高 性 能 计算 应 用 的 研究 。 公 司 还 与 
华中 科技 大 学 共同 组 建 了 一 个 高 性 能 计算 生物 信息 联合 实验 室 , 以 及 与 北京 航空 航天 大 学 联 
合 组 建 了 一 个 高 性 能 计算 虚拟 现实 实验 室 。 正 如 之 前 在 83.1.2 中 提 到 的 ,浪潮 正在 开发 受 863 


项 目 支 持 的 基于 Intel CPU 和 QPI 接口 的 32 路 高 端 容错 计算 产品 。 
7.4 宝 德 


位 于 深圳 的 宝 德 科技 集团 有 限 公 司 (PowerLeader) 是 一 家 主要 从 事 服务 器 制造 的 民营 
企业 。 作 为 英特尔 公司 在 中 国 最 重要 的 战略 合作 伙伴 之 一 ， 以 及 英特尔 安 腾 解决 方案 联盟 
(ISA) 的 唯一 中 国 成 员 ， 宝 德 专注 于 Intel IA 架构 的 服务 器 开发 。 通 过 与 法 国 布尔 (Bull) 公 
司 合作 成 为 国内 目前 唯一 提供 32 路 SMP CC-NUMA 小 型 机 的 服务 器 厂商 。 


> 宝 德 公司 搭建 的 高 性 能 计算 系统 安装 在 深圳 华 大 基因 研究 中 心 用 来 进行 亚洲 黄种 人 基 
Die 因 组 项 目 和 大 熊猫 基因 组 项 目 。 


7.5 红 神 


上 海 红 神 信息 技术 有 限 公 司 (RedNeurons) 创立 于 2005 年 ， 公 司 创始 人 是 美国 纽约 州 
立 大 学 石 溪 分 校 (Stony Brook) 应 用 数学 系 教授 邓 越 凡 。 在 中 国 科技 部 和 上 海 市 科 委 以 及 一 
些 合资 公司 的 支持 下 ， 红 神 开 发 了 一 个 能 够 支持 应 用 程序 运行 的 原型 系统 。 该 系统 使 用 16 
个 IBM PowerPC 低 功 耗 CPU 模拟 它 设计 中 的 16 个 CPU 核 , 用 现场 可 编程 门 阵列 实现 了 一 
个 性 能 相当 于 千 兆 以 太 网 的 互连网 络 。 


红 神 公司 2008 年 向 科技 部 的 国家 高 科技 863 计划 申请 了 RedNeurons-2 项 目 , 申请 经 费 
1.2 亿 元 (其 中 科技 部 6000 万 ， 上 海 市 6000 万 )， 进 行 高 性 能 计算 机 的 探索 性 技术 的 研究 ， 
预期 用 2 年 时 间 完 成 一 个 全 部 采用 现场 可 编程 门 阵列 实现 的 、 体 现 新 型 体系 结构 和 创新 技术 
的 、 相 当 于 100 万 亿 次 通用 计算 能 力 的 原型 系统 。 然 而 该 项 目 还 存在 一 些 争议 ， 一 些 中 国 的 
科学 家 仍 对 RedNeurons 设计 中 采用 的 方法 存疑 。 


8 ”2009 年 中 国 高 性 能 计算 百 强 (Top 100) 


我 国有 一 个 最 快 的 前 一 百名 计算 机 系统 排行 榜 ， 称 为 “中 国 HPC TOP100” 。 该 排行 
榜 由 中 国 软件 行业 协会 数学 软件 分 会 、 中 国 软件 行业 协会 和 863 计划 高 性 能 计算 评估 中 心 共 
司 维护 。 自 2002 年 起 每 年 秋季 发 布 。 至 今 ， 一 年 一 次 的 中 国 HPC Top100 已 经 得 到 研究 人 
员 、 用 户 、 广 商 和 政府 部 门 的 广泛 认可 ， 成 为 观察 中 国 高 性 能 计算 现状 的 重要 窗口 ， 很 多 用 
户 购买 高 性 能 计算 机 的 必要 参考 和 评 标 依据 。 


2009 年 11 月 1 日 中国 HPC Top100 排行 榜 2009 版 正式 发 布 ， 其 中 Top10 见 下 表 7。 
2009 年 中 国 Top100 排行 榜 主 要 体现 出 了 以 下 几 个 趋势 


@ 国产 系统 继续 位 居 榜 首 ， 且 在 历史 上 首次 出 现 峰 值 超过 1PFlops 的 机 器 ， 比 预期 时 间 提 
前 一 年 ; 

@ Top100 总 体 Linpack 性 能 达 2.2PFlops， 与 2008 年 相 比 ， 性 能 提升 了 2.12 倍 ， 标 志 着 
中 国 高 性 能 计算 机 市 场 已 处 于 快速 增长 期 ; 


| 
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@ Top100 平均 Linpack 性 能 达 22TFlops, 而 Top500 平均 Linpack 性 能 达到 22TFlops 的 时 


间 是 2008 年 6 月， 中 国 与 世界 的 差距 保持 在 一 年 半 ; 
@ 上 榜 系 统 的 性 能 门槛 大 幅 提 高 ，Linpack 性 能 需要 达到 6.8 万 亿 次 ， 是 2008 年 的 2.04 
倍 ; 


@ 96 套 系统 采用 机 群 结构 ， 机 群 结构 继续 占据 主导 地 位 ， 计 算 机 体系 结构 创新 面临 挑战 ; 
@ 首次 出 现 CPU+GPGPU 混合 加 速 的 PFlops 机 器 ; 
@ 国内 服务 器 品牌 首次 在 上 榜 数 量 、 总 体 性 能 上 超过 国外 品牌 。 


表 7. 中 国 TOP100 排行 榜 2009 年 TOP10 
序 ”研制 处 理 Linpack 值 峰值 
中 民 二: Y 领 

号 厂商 于 安装 地 反 年份 应 用 领域 器 核 (GFlops) (GFlops) 
国防 _.、 国家 超 算 科学 计算 / 

1 天 河 一 号 2 24576 100 ”1206210 
I BE 
中 广 方 -曙光 上海 超级 pe 

2 ”电光 DOGA 计算 中 心 2008 ”科学 计算 30720 ”180600 233472 

到 科学院 
3 ”联想 深 腾 7000 ee 2008 科学 计算 ”10096 106500 145293 
项 9 

4 ”IBM Hececenter 网 络 公司 ”2009 工业 /游戏 ”7168 ”38790 72540 

5 IBM Bene 网 络 公司 ”2009 工业 /游戏 7168 38790 72540 

6 IBM EeeCenter 网 络 公司 ”2009 工业 /游戏 ”7168 ”38790 72540 

BladeCenter Ee 科学 计算 / 
7 IBM ps Clusio。 南京 大 学 。 2009 教育 3200 ”31310 34048 
计算 物理 国家 本 
8 上 曙光 曙光 5000 计算 物理 国家 2009 科学 计算 3360 31048 40320 
重点 实验 室 
9 ”IBM Eeecenter 网 络 公司 2009 工业 /游戏 5376 31030 54410 
BladeCenter 


10 IBM foe22 Cluster 网 络 公 司 2009 工业 /游戏 ” 5376 ”31030 54410 


9 ”中 国 高 性 能 计算 技术 和 应 用 发 展 趋势 


中 国 的 高 性 能 计算 技术 正在 向 多 样 化 发 展 ， 以 满足 不 同 应 用 对 系统 和 软件 的 不 同 需求 。 
从 以 往 同 质 化 的 机 群 和 单纯 追求 计算 速度 ， 向 异 构 体系 结构 和 应 用 主导 的 计算 发 展 。 同 时 ， 
在 应 用 类 型 方面 ， 与 以 计算 为 中 心 的 应 用 相 比 ， 以 数据 为 中 心 的 应 用 正 变 得 越 来 越 流行 。 


9.1 新 高 性 能 计算 项 目 
9.1.1 个 人 高 性 能 计算 机 (Personal High-Performance Computer，PHPC ) 


个 人 高 性 能 计算 机 (PHPC) 是 一 种 普及 型 超级 计算 设备 ， 开 发 动机 是 促使 超级 计算 设 
备 能 普及 到 所 有 的 科学 家 和 工程 技术 人 员 ， 以 及 所 有 需要 高 性 能 计算 的 各 领域 的 用 户 个 体 。 
晶 是 , 简单 地 把 高 性 能 计算 机 小 型 化 远 远 不 能 满足 个 人 高 性 能 计算 机 系统 的 实际 需求 。 个 人 
高 性 能 计算 机 核心 技术 包括 : 低 功 耗 处 理 器 、 适 合 桌面 环境 的 系统 设计 、 面 向 大 众 用 户 的 jj 
行 编程 模型 以 及 与 PC 兼容 的 使 用 环境 等 。 目 前 , 国内 已 有 一 些 个 人 高 性 能 计算 机 系统 面 
到 2015 年 ， 万 亿 次 级 别 的 个 人 高 性 能 计算 机 有 望 成 为 主流 产品 。 下 文 对 国内 的 个 人 高 性 角 
计算 机 工作 进行 简 述 。 
在 中 国 科技 大 学 计算 机 系 ， 由 陈 国 良 院士 领导 的 团队 开展 了 KD-50 个 人 高 性 能 计算 机 


~ 


于 


bai 
CC o 
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研究 , 在 2007 年 12 月 完成 了 一 台 如 图 6 所 示 代 号 为 “KD-50-1* 的 基于 龙芯 2F 处 理 器 的 万 亿 
次 系统 。 该 系统 是 一 台 使 用 千 兆 以 太 网 的 单机 柜 机 群 , 共 使 用 336 颗 750MHz 龙芯 2F CPU， 
其 中 每 个 1U 机 箱 内 放置 12 颗 CPU。2008 年 ，KD-50-1 又 生产 了 2 台 。 


2010 年 4 月, 该 团队 又 发 布 了 KD-50-II 
万 亿 次 系统 。 它 包含 10X1U 计算 节点 和 2U 
服务 节点 , 共 使 用 80 颗 龙芯 3A 四 核 处 理 器 
和 160GB 内 存 。 该 系统 理论 峰值 运算 能 力 为 
1TFlops, 但 大 小 仪 相当 于 KD-50-I 的 三 分 之 
一 ， 也 即 比 普通 洗衣 机 还 小 。 另 外 ， 它 的 功 


耗 为 2.4kW， 不 足 KD-50-I 功 耗 的 56%。 ER 
此 外 ， 该 团队 计划 在 2011 年 底 推出 (a) (b) 


KD-50-III 万 亿 次 系统 。 这 是 一 台 使 用 定制 的 图 6. KD-50-I1 (a) 和 KD-50-II (b) 

64 端口 干 兆 以 太 网 的 桌面 式 机 群 系统 ， 共 8 

颗 1GHz 的 带 向 量 处 理 部 件 的 8 核 龙芯 3 处 理 器 , 在 系统 软件 和 并 行 编程 方法 上 将 更 关注 个 
人 用 户 体验 。 


中 国 科学 院 计算 技术 研究 所 和 英特尔 公司 合作 ， 推 出 了 一 款 基 于 16 个 低 功 耗 的 英特尔 
4 核 Xeon 处 理 器 的 桌 边 型 (deskside) 个 人 高 性 能 计算 机 原型 系统 ， 整 机 电流 小 于 5 安培 ， 
使 用 定制 的 64 端口 干 兆 以 太 网 交换 机 作为 互 连 。 该 系统 在 2009 年 的 英特尔 北京 信息 技术 峰 
会 (IDF)、 英 特 尔 中 国 研究 院 开放 日 、SC09、HPCChina09 等 会 议 上 进行 了 展示 。 


上 曙光 公司 在 2008 年 也 推出 了 曙光 天 潮 PHPC100 个 人 高 性 能 计算 机 。 这 是 专门 为 办 公 
室 应 用 环境 设计 的 桌 边 型 高 性 能 计算 机 产品 ， 其 定位 与 Cray CX1 类 似 。 它 具有 10 颗 4 核 
处 理 器 ， 使 用 Infiniband 互连网 络 ， 采 用 整体 优化 设计 ， 有 效 地 降低 了 系统 功 耗 。 


从 产业 化 角度 分 析 , 如 何 定 位 个 人 高 性 能 计算 机 系统 的 用 户 群 是 需要 考虑 的 问题 。 英 特 
尔 和 AMD 的 片上 多 处 核 理 器 芯片 已 经 成 为 面向 大 众 的 并 行 计 算 系 统 , 可 以 满足 普通 用 户 绝 
大 多 数 的 应 用 需求 ; 以 云 计算 为 代表 的 要 求 对 计算 资源 集中 管理 的 使 用 模式 , 是 普及 高 性 能 
计算 的 另 一 条 道路 。 广 大 科研 工作 者 、 金 融 分 析 师 、 设 计 与 规划 人 员 、 生 物 学 家 能 成 为 个 人 
高 性 能 计算 机 的 潜在 用 户 群体 , 但 是 其 多 变 的 计算 类 型 和 各 蜡 的 计算 特征 使 得 一 套 通用 系统 
解决 方案 很 难 同时 满足 各 种 用 户 的 需求 。 这 就 要 求 个 人 高 性 能 计算 机 的 处 理 器 具有 一 定 的 可 
定制 性 ， 而 一 台 个 人 高 性 能 计算 机 系统 的 性 能 应 该 比 PC 高 一 个 数量 级 以 上 。 未 来 个 人 高 性 
能 计算 机 的 用 户 群 体 将 是 各 行业 内 对 高 性 能 计算 有 特定 需求 的 人 群 , 系统 也 将 分 为 固定 的 肾 
面 型 和 移动 的 膝 上 型 。 


9.1.2 GPU Cluster 


GPU 最 初 是 面向 图 形 和 游戏 应 用 开发 的 高 性 能 处 理 器 ， 其 中 NVIDIA 是 主要 的 生产 商 
之 一 。 目 前 ， 不 论 西方 还 是 中 国 ， 都 将 GPU 用 于 更 加 通用 的 应 用 中 作为 一 个 重要 的 研究 课 


题 。 


GPU 机 群 是 一 种 在 标准 机 群 的 计算 节点 中 增加 GPU 加 速 卡 的 高 性 能 计算 机 ， 其 性 能 和 
兼容 性 已 经 得 到 中 国 许多 用 户 的 广泛 认可 , 国防 科技 大 学 开发 的 Tianhe-1 和 由 中 科 院 计算 所 
与 电光 公司 合作 开发 的 Nebulae 都 采用 了 这 种 技术 。 


中 国 科学 院 过 程 工程 研究 所 获得 了 约 1 亿 元 人 民 币 的 资助 从 事 多 相反 应 研究 , 研究 颗粒 


36 


第 9 卷 第 4 期 信息 技术 快报 Vol.9 No.4 

Information Technology Letter Jul. 2011 
和 流体 同时 存在 的 系统 中 物质 运动 、 传 递 和 转化 过 程 的 共性 规律 。 他 们 研制 的 属于 分 子 动力 
学 范畴 的 粒子 模拟 并 行 算法 具有 鲜明 的 特点 : 并 行 度 大 、 计 算 密集 、 数 据 量 小 、 通 信 具 有明 
显 的 局 部 性 。MDGRAPE、QCDOC、Anton 等 专用 高 性 能 计算 机 解决 的 就 是 这 类 问题 ， 这 
类 问题 也 非常 适合 用 GPU 进行 计算 。 


过 程 所 于 2008 年 搭建 了 一 台 代 号 为 Mole-9.7 (图 7) 的 GPU 机 群 用 于 粒子 模拟 应 用 。 
该 系统 使 用 了 120 台 HP PC 机 ， 搭 载 了 240 块 NVIDIA GPU 图 形 卡 ， 处 理 能 力 达 到 单 精 度 
200TFlops。 其 网 络 采用 2D-mesh 点 到 点 的 连接 方式 ， 即 一 台 PC 配置 4 个 千 光 以太 网 卡 ， 
不 经 过 交换 机 进行 两 两 互 连 。 此 外 还 有 一 台 用 于 全 局 通信 的 以 太 网 交换 机 ， 组 装 方式 是 将 
120 台 立 式 PC 放置 在 2 排 共 30 个 架子 上 ， 由 普通 立 式 空调 进行 散热 。2009 年 ，Mole-9.7 
升级 后 峰值 性 能 达到 450TFlops。 此 外 ， 过 程 所 还 基于 GPU 建立 了 一 个 全 新 的 系统 ， 即 
Mole-9.7F， 峰 值 性 能 达到 单 精度 150TFlops。 同 时 ， 上 曙光 、 联 想 公 司 分 别 为 过 程 所 研制 了 2 
台 单 精度 200 TFlops 的 基于 Infiniband 的 GPU 机 群 系统 ， 即 Mole-9.5L 和 Mole-9.5D。 四 组 
GPU 机 群 通过 千 兆 以 太 网 互 连 成 一 个 多 层 体系 , 其 性 能 达到 了 单 精度 1PFlops。 中 国 科学 院 
还 在 10 个 研究 所 推广 了 这 个 项 目 中 上 电光、 联想 公司 研制 的 GPU 机 群 产品 。 


在 2010 年 早 些 时 候 ， 过 程 所 使 用 NVIDIA 攻 。 > 
Tesla C2050 GPGPU 搭建 了 另 一 个 GPU 机 群 ， 即 六 
Mole-8.5。 这 个 系统 包含 372 个 计算 和 数据 处 理 ， 
节点 。 单 个 节点 是 4U 双 路 Xeon 服务 器 , 与 6 个 
Tesla C2050 GPGPU 耦合 , 并 晶 通 过 infiniband 互 
连 。 系 统 的 理论 性 能 峰值 达到 双 精 度 ， 
1.138PFlops 。 


我 国 本 土 供应 商 生 产 的 儿 球 GPU 机 群 系统 图 7. Mole-8.5 多 尺度 离散 模拟 系统 
已 经 进入 商业 化 阶段 。 由 曙光 公司 开发 的 GPU 机 群 代 号 为 GHPC1000， 其 计算 节点 采用 单 
机 箱 双 节点 (Twins〉 技 术 ， 在 2U 的 空间 内 提供 4 个 AMD 四 核 处 理 器 、2 块 GPU 卡 、8 
块 SSD 硬盘 。GHPC1000 互连网 络 可 以 是 Infiniband 网 络 或 千 兆 以 太 网 。 同时， 浪潮 公司 推 
出 了 倚天 Tesla HPC 机 群 ， 采 用 NVIDIA Tesla S1070 计算 系统 搭建 。 宝 德 公司 也 推出 了 


一 PowerScale 8000G， 包 括 一 台 PR4710D 四 路 四 核 服务 器 ， 配 备 2 块 Nvidia Tesla 1070 GPU。 
© 此 外 ， 还 计划 把 Nvidia Tesla 系统 引入 宝 德 PS1000 个 人 超级 计算 机 中 。 
9.2 技术 发 展 趋势 


9.2.1 众 核 机 群 


过 去 20 年 微 处 理 器 技术 的 发 展 让 中 国 的 高 性 能 计算 机 的 水 平 迅 速 妃 上 国际 水 平 ， 通 过 
X86 多 核 处 理 器 和 机 群 技术 中 国 目 前 有 能 力 建 造 干 万 亿 次 系统 。 


通过 曙光 5000A 的 技术 路 线 ， 使 用 12800 颗 左右 的 AMD 12 核 “ 马 尼 库 尔 ” 处 理 器 ， 约 
3200 个 刀片 ， 可 以 构建 能 耗 在 2 兆 瓦 内 的 PFlops 系统 。 从 产业 的 角度 考量 ， 这 样 的 技术 路 
线 在 未 来 依然 是 满足 大 多 数 中 小 型 高 性 能 计算 用 户 需 求 的 主要 方式 。 国 际 上 ， 正 在 研发 的 
BlueWater 在 2012 年 有 望 能 达到 20PFlops 的 性 能 。 在 这 样 级 别 的 高 性 能 系统 ， 面 向 主流 开 
市 场 的 通用 X86 多 核 处 理 器 将 无 法 解决 在 功 耗 、 编 程 、 可 靠 性 等 方面 的 挑战 。 


拥有 片 内 大 规模 并 行 能 力 ， 具 有 一 定 显 式 存储 访问 特点 的 GPU、CELL、 现 场 可 编程 门 
阵列 等 处 理 器 ,与 通用 处 理 器 一 起 构成 的 异 构 系 统 在 部 分 应 用 领域 已 经 成 为 用 户 的 选择 。 美 
国 的 RoadRunner 和 中 国 的 Tianhe-1 系统 问鼎 Top500，GPU 机 群 在 中 国 流行 就 是 有 力 的 证 
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明 。 这 种 专用 部 件 加 通用 平台 的 方式 , 将 成 为 中 国 未 来 高 性 能 计算 机 的 一 种 有 效 结构 ,但 由 
于 处 理 器 体系 结构 的 专用 性 质 ， 不 可 能 成 为 市 场 主流 技术 。 


中 国学 术 界 普遍 认为 基于 能 扩展 到 千 核 规模 的 众 核 处 理 器 的 并 行 系统 (大 规模 并 行 或 星 
群 或 机 群 ) 是 未 来 高 性 能 计算 机 的 主流 技术 ， 尤 其 是 众 核 机 群 将 会 是 市 场 主流 产品 。 同 时 ， 
龙芯 处 理 器 的 研制 成 功 和 产业 化 使 中 国 拥有 了 研制 科学 计算 领域 通用 处 理 器 的 能 力 和 市 场 
基础 。 中 国学 术 界 目前 在 众 核 机 群 上 的 研究 主要 集中 在 并 行 编程 模型 、 并 行 算法 设计 、 并 行 
系统 见 余 设计 三 个 方面 。 


@ 如何 定 义 千 核 处 理 器 的 编程 模型 , 以 及 设计 与 之 对 应 的 编程 语言 是 一 个 十 分 具有 挑战 性 
的 问题 。 中 科 院 计算 所 的 Godson-T 64 核 处 理 器 、 国 防 科大 的 流 式 处 理 器 和 基于 MIPS 
的 64 核 处 理 器 研究 ， 都 试图 在 保证 良好 的 可 编程 性 的 前 提 下 提高 众 核 的 性 能 。 

@ 并行 算 法 的 可 扩展 性 是 决定 一 个 应 用 在 一 个 包含 数 以 千 计 的 处 理 器 芯片 、 数 以 百 万 计 的 


计算 核 的 超大 规模 并 行 系统 上 的 运行 效率 的 重要 因素 ,加州 大 学 伯克利 分 校 在 他 们 的 技 
术 白 皮 书 中 也 指出 , 未 来 科学 计算 的 负载 将 呈现 出 多 样 与 非 规 则 访 存 的 特性 。 中 国学 者 
正在 算法 和 体系 结构 支持 两 个 层面 研究 如 何 支 持 细 粒 度 多 维度 并 行 性 以 及 如 何 应 对 非 
> 规则 访 存 。 
人 - @ 随 着 高 性 能 计算 机 系统 规模 的 持续 增加 ， 对 容错 性 的 支持 显得 尤为 重要 。 单纯 通过 物理 
SN 器 件 层面 的 改进 将 无 法 满足 未 来 系统 需求 。 中 国学 者 正在 容错 的 并 行 算法 ， 自 诊断 、 自 
© 恢复 的 操作 系统 上 开展 相关 研究 。 
. 9.2.2 高 通 量 计算 机 
区 面向 高 通 量 应 用 (High Throughput) 的 高 性 能 计算 机 (HTC) 是 未 来 应 着 重 研究 的 技术 
一 方向 。 传 统 的 高 端 计 算 机 主要 分 为 两 类 : 高 性 能 计算 机 (High performance computers，HPC) 
和 高 可 靠 计 算 机 (High reliability computers, HRC)。 高 性 能 计算 机 追求 单个 并 行 应 用 的 计算 
re 性 能 ， 主 要 用 于 科学 计算 领域 ;高 可 靠 计 算 机 则 追求 系统 及 应 用 的 高 可 靠 性 和 高 可 用 性 ， 主 


要 用 于 商业 计算 领域 。 以 海量 数据 和 基于 互联 网 的 服务 为 特点 的 新 兴 应 用 ， 如 谷歌 , 则 大 多 
具有 高 通 量 的 负载 特征 ， 而 且 中 国 的 网 络 用 户 众 多 ， 否 吐 率 的 瓶颈 问题 将 更 加 突出 。 


E 高 通 量 计 算 机 定义 为 “提供 交互 式 、 高 并 发 负载 服务 的 高 可 扩展 、 低 成 本 的 大 型 计算 机 
CS 软 硬 件 系统 ”。 高 通 量 计算 与 传统 的 高 端 计算 机 相 比 有 如 下 一 些 显著 差异 : 


@ 性 能 高 通 量 计算 追求 单位 时 间 内 所 处 理 的 并 发 负载 数量 而 非 单 一 峰值 计算 速度 ; 

@ 耦合 度 高 性 能 计算 的 处 理 单 元 之 间 耦 合 度 高 ， 应 用 的 性 能 依赖 于 负载 均衡 、 同 步 与 通 
讯 开 销 ; 高 通 量 计算 应 用 中 通常 存在 大 量 的 并 发 任务 ， 单 任务 内 的 耦合 度 高 ,不同 应 用 
任务 间 耦 合 度 低 ， 很 少 需要 全 局 同步 与 通信 ; 

@ 可 靠 性 高 通 量 计算 应 用 的 任务 间 松 散 的 耦合 关系 ， 使 得 软 硬 件 部 件 的 故障 不 会 影响 整 
个 系统 ; 

@ 成 本 高 通 量 计算 系统 对 成 本 比 高 性 能 计算 要 敏感 得 多 ， 和 谷歌 等 公司 因此 会 自己 开发 专 
门 的 服务 器 和 网 络 交换 机 。 


高 通 量 计算 这 一 概念 由 工业 界 提 出 ， 人 谷歌、 亚马逊 (Amazon)、Facebook 等 国外 公司 已 
经 展开 了 相关 的 研究 , 但 主要 集中 在 应 用 层面 , 在 系统 层面 则 多 是 一 些 技术 集成 和 解决 方案 
方法 ; Sun( 升 阳 ) 公司 的 T1 处 理 器 可 以 说 是 一 款 高 通 量 计算 处 理 器 。 国 内 对 高 通 量 计算 
的 研究 还 处 于 起 步 阶段 ， 在 文 持 数 百 TB 数据 的 并 发 存储 、 索 引 、 并 发 访问 的 数据 管理 系统 
上 有 一 些 研究 。 中 国学 者 认为 需要 首先 研究 如 下 关键 性 问题 : 
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@ 由 于 学 术 界 难以 对 工业 界 高 通 量 计 算 应 用 进行 跟踪 ， 要 理解 用 户 行 为 、 分 析 应 用 特征 ， 
必须 通过 设计 合理 的 性 能 测试 标准 (Benchmark)， 定 量 地 分 析 不 同 高 通 量 计算 应 用 的 
特征 ; 

@ 为 高 通 量 计算 系统 专门 设计 可 支持 海量 并 发 线程 的 处 理 器 , 并 按 吞 吐 率 优先 的 原则 优化 


@ 专门 设计 可 文 持 海量 并 发 轻 量 级 线程 、 资 源 能 够 按 细 粒度 供给 的 系统 软件 栈 , 包括 操作 
系统 、 运 行 时 环境 ; 
@ 高 通 量 计算 应 用 的 一 个 重要 的 特点 就 是 海量 数据 的 大 规模 并 发 处 理 , 这 就 要 求 按 否 吐 率 
优先 原则 设计 数据 的 存储 、 传 输 、 访 问 模 式 。 细 粒度 轻 量 级 线程 级 并 行 编程 模型 将 更 适 
合 于 高 通 量 计算 应 用 。 


9.3 应 用 发 展 趋势 
9.3.1 基于 海量 数据 的 高 性 能 计算 服务 


基于 海量 数据 的 科学 研究 和 服务 正 日 益 成 为 当前 的 主流 ， 互 联网 服务 就 是 其 典型 应 用 。 
一 例如 , 谷歌 和 百度 的 互联 网 搜索 服务 , 亚马逊 和 淘宝 的 B2C 服务 , Facebook 和 校内 网 的 SNS 
服务 ,Fliker 和 Google Picasa 的 图 片 服务 ，Google Earth 和 IBM Smarter Planet 的 地 理 定位 服 
J 务 。 除 了 上 述 互联 网 应 用 外 ， 下 面 儿 个 基于 海量 数据 的 高 性 能 计算 服务 在 中 国正 不 断 发 展 : 


@ 生物 信息 处 理 服 务 基于 基因 序列 库 、 和 蛋白 质 序列 库 、 蛋 白质 结构 库 的 高 性 能 计算 服务 ; 

@ 智能 信息 处 理 服 务 如 基于 大 规模 实例 学 习 的 统计 翻译 、 大 规模 领域 知识 库 的 构建 和 应 

用 ; 

@ 面向 大 众 的 教育 服务 采用 云 计算 模式 ， 实 现 中 国 数 亿 学 生 的 普及 教育 ; 

@ 国民 健康 工程 为 中 国 的 全 体 国 民 提 供 低 成 本 的 体检 服务 ， 并 建立 全 民 健康 档案 ; 

@ 感知 中 国 工程 这 是 中 国政 府 正在 大 力 倡 导 的 与 IBM 智 意 地 球 对 应 的 工程 , 前 端 是 对 物 

时 世界 的 感知 ,中间 是 基于 宽带 无 线 通 信 技 术 的 数据 传递 , 后 端 则 是 基于 海量 传 感 数据 
的 智能 处 理 与 决策 ; 

@ ”基于 大 科学 工程 的 计算 服务 大 科学 服务 基础 设施 , 如 上 海光 源 (同步 辐射 )、LAMOST 
天 文 望远镜 、 上 海 蛋 白质 科学 研究 基础 设施 、 深圳 散 列 中 子 源 、 北京 正 负 电子 对 撞 机 等 ， 
都 产生 海量 的 数据 ， 而 科学 发 现 高 度 依赖 于 这 些 数据 以 及 高 性 能 计算 。 


ed 在 互联 网 应 用 领域 ,谷歌 的 GFS、BigTable 和 MapReduce， 雅 虎 (Yahoo!) 的 HDFS， 
微软 的 基于 有 向 无 环 图 的 数据 流 编 程 模型 Dryad， 谷 歌 的 大 规模 图 结构 编程 模型 Pregel， 正 
成 为 事实 上 的 工业 标准 和 它们 各 自 的 核心 技术 。 中 国 需要 开发 类 似 的 技术 以 满足 上 述 应 用 在 
数据 存储 和 管理 技术 方面 的 需求 。 此 外 ， 以 数据 为 中 心 组 织 计算 的 计算 模型 ， 提 供 不 间 断 服 
务 的 容错 技术 , 近似 精确 计算 模型 等 方面 的 需求 也 需要 新 技术 的 支持 。 这 些 新 兴 应 用 也 理 含 
着 新 的 商业 机 会 。 
9.3.2 与 情 计算 
互联 网 可 以 与 真实 的 人 类 社会 建立 映射 关系 。 对 互联 网 上 的 内 容 、 用 户 行为 的 监控 、 分 
析 可 以 等 价 于 对 社会 和 消费 者 的 研究 ， 这 一 方式 正成 为 中 国政 府 、 媒 体 、 企 业 十 分 关注 的 新 
兴 应 用 。 
与 情 泛 指 在 一 定 的 社会 空间 内 ,民众 对 社会 管理 者 持 有 的 社会 政治 态度 , 在 商业 活动 中 
所 持 有 的 生活 态度 等 。 和 与 情 计算 就 是 通过 面向 网 络 的 自然 语言 分 析 、 信 息 提 取 、 热 点 分 析 、 
信息 检索 、 文 本 聚 类 、 主 题 检 测 与 追踪 、 观 点 倾向 性 识别 、 自 动 摘 要 和 信息 预测 等 技术 发 现 
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这 些 态度 ， 从 而 指导 政府 或 者 企业 决策 。 
与 情 计 算 涉及 到 对 大 规模 互联 网 日 志 、 互 联网 文本 数据 进行 处 理 、 分 析 。 其 中 ， 与 高 性 
工 
全 


能 计算 相关 的 技术 包括 : 数据 的 存储 、 数 据 的 移动 、 数 据 的 分 析 ， 分 布 式 的 分 词 提取 方法 ， 
大 规模 并 行 数据 库 ， 并行 查询 方法 ， 超大 规模 实时 查询 等 。 与 情 计 算 也 是 高 通 量 计算 机 的 
个 杀手 铀 应 用 。 


中 国 通过 863 计划 资助 的 科研 项 目 建立 起 来 的 舆情 分 析 系统 包括 以 下 核心 功能 : (1) 热 
点 和 敏感 话题 的 识别 ; (2) 人群 倾向 性 分 析 ; (3) 主题 跟踪 ;4) 针对 对 各 类 主题 和 倾向 的 
自动 摘要 ; (5) 趋势 分 析 ; (6) 突 发 事件 分 析 与 预测 ;(7) 对 特定 事件 、 话 题 的 及 时 发 现 与 
报警 ; 〈8) 统计 报告 与 决策 支持 。 但 现 有 的 系统 无 论 在 处 理 数据 的 规模 上 ， 还 是 在 数据 分 析 
的 能 力 上 都 远 远 不 能 满足 用 户 的 需要 。 


10 与 国际 发 展 的 比较 


上 世纪 90 年 代 以 来 ， 中 国 已 经 在 高 性 能 计算 领域 取得 了 重大 进展 ， 掌 握 了 一 些 关键 技 
术 ， 形 成 了 自己 的 产业 ， 高 性 能 计算 得 到 广泛 应 用 。 但 是 ， 与 美国 、 日 本 和 西欧 相 比 ， 在 系 
统 开发 层次 、 应 用 层次 和 长 期 规划 方面 ， 依 然 存在 差距 。 下 面 以 中 国 研究 人 员 的 视角 ， 从 几 
个 重要 方面 与 国际 水 平 进行 对 比 。 


10.1 ”高 性 能 计算 系统 


德国 
田 日 本 
美国 
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图 8， 主 要 国家 占有 率 演 变 图 (1993-2010) 


随 着 中 国 经 济 的 发 展 和 在 计算 机 系统 领域 研发 的 进展 ， 中 国 在 TOP500 中 席位 由 1990 
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年 代 的 一 两 台 发 展 到 进入 本 世纪 来 的 儿 十 台 ( 如 图 8 所 示 )。 在 2010 年 6 月 的 TOP500 列表 
中 ， 中 国 以 24 台 系 统 在 总 数 上 与 德国 并 列 排名 第 四 ， 份 额 在 TOP500 台 系 统 中 占 到 4.8%。 
中 国 在 TOP500 中 所 占 份 额 显示 了 国内 市 场 对 高 性 能 计算 机 的 需求 呈 上 升 趋势 , 与 中 国 经 济 
占 世 界 经 济 的 份额 基本 相当 。 


美国 始终 是 高 性 能 计算 领域 的 领导 者 ， 其 霸主 地 位 无 可 争议 。 在 2010 年 6 月 的 排行 榜 
中 ， 美 国有 282 台 系统 。 其 中 ，TOP10 中 的 7 台 〈 表 8) 都 安装 在 美国 。 我 们 通过 比较 过 去 
50 年 中 中 美 有 代表 性 的 高 性 能 系统 ,以 年 来 衡量 表 8. 主要 国家 所 占 份额 (2010 年 6 月 ) 
两 国 的 技术 差距 ， 如 表 9 所 示 ， 中 美的 技术 差距 ” ”国家 数量 份额 


正在 缩小 。 当 2004 年 曙光 4000A 在 TOP500 中 美国 282 56.40% 
排 到 第 10 位 的 时 候 ， 这 个 差距 缩小 到 两 年 ， 而 英国 38 7.60% 
星云 系统 则 进一步 将 差距 缩短 到 仅仅 一 年 。 但 法 国 27 5.40% 
是 ， 在 将 来 一 段 时 间 内 ， 这 个 差距 将 持续 存在 。 中 国 24 4.80% 

根据 中 国 TOP100 的 数据 ， 高 性 能 计算 总 性 。 德国 2 0 
能 正在 快速 增长 。 中 国 TOP100 系统 的 性 能 总 和 ”日本 SU 
从 2008 年 到 2009 年 已 经 翻 了 一 番 多 ,由 1.036P 。 俄罗斯 Se 
Flops 增长 到 2.2PFlops; 同期 ,TOP500 中 所 有 系 珊 典 ee 
统 的 总 性 能 的 增长 则 是 1.63 倍 。 中 国 TOP100 系 。 ”加 售 大 RAR 
统 的 平均 Linpack 性 能 在 2009 年 是 22TFlops; 作 。 ， 意 信 利 ad 
为 对 比 ， 世 界 TOP500 系统 在 2008 年 6 月 的 数 新 本 三 a 


据 则 是 23.4TFlops。 在 Linpack 平均 性 能 方面 ， 中 国 落 后 了 将 近 1.5 年 ， 也 就 是 摩尔 定律 的 
一 代 (18 个 月 )。2009 年 12 月 , 世界 TOP500 和 中 国 TOP100 的 平均 Linpack 性 能 比 是 2.5， 
小 于 2008 年 的 3.27， 这 说 明 中 国正 在 追 上 世界 水 平 。 


表 9. 中 国 与 国际 同行 的 技术 差距 


在 体系 结构 方面 中国 要 一 一 一 一 一 一 一 一 一 一 
落后 于 其 他 居于 前 列 的 国家 。 于 算 机 ae 
中 国 2009 年 TOP100 中 有 96 103 机 ENIAC 1958 1954 13 
个 (2008 年 为 92 个，2007 年 ”109B 机 IBM7090 1965 1959 6 
为 75 个 ) 系统 是 机 群 ， 机 群 150 人 IBM360 1973 1964 9 
不 但 继续 占 主导 地 位 ， 且 份额 “757 巾 轩 机 Cray-1 en 
还 在 继续 快速 上 升 ， 大 有 -一统 ， 1000 ”Paragon 1995 1990 5 
天 下 的 趋势 。 国 际 TOP500 虽 电光 2000 IBM SP2 1998 1994 4 
然 也 是 这 个 趋势 ， 但 机 群 仅 占 a 4000 EarthSimulator 2004 2002 2 
到 83.4%， 远 低 于 中 国 2009 光 5000 BlueGene/L 2008 ”2006 2 
年 TOP100 中 的 96%。 2009 年 ”大河 -1 | Roadrunner 2009 2008 1.5 
6 月 公布 的 最 新 TOP500 中 ， 晓 光 星云 Jaguar 2010 ”2009 1 
只 有 3 套 机 群 系统 进入 天 河 -1A Jaguar 2011 2011 0 
TOP10， 表 明美 国 、 日 本 等 国家 在 采用 新 体系 结构 的 高 性 能 计算 机 方面 积极 探索 ， 而 在 中 国 
还 看 不 到 这 种 转变 ,体系 结构 日 趋同 步 化 。 在 超级 计算 机 的 体系 结构 创新 上 ， 国 家 投入 力度 


不 够 ， 研 究 机 构 也 缺乏 创新 勇气 ， 这 将 会 影响 国产 高 性 能 计算 机 的 发 展 后 劲 。 
10.2 ”高 性 能 计算 应 用 


尽管 在 硬件 和 系统 方面 , 中 国 与 发 达 国家 的 差距 在 迅速 缩小 , 但 是 在 高 性 能 计算 应 用 方面 却 
不 尽 如 此 。 中 国 高 性 能 计算 社区 普遍 认为 这 是 未 来 中 国 高 性 能 计算 发 展 的 瓶颈 。 中 国学 者 认 
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为 ， 中 革 
的 高 性 能 计算 系统 ， 


旦 是 


规模 和 求解 精度 。 商 业 软 件 的 昂贵 价格 和 拥有 上 
E 能 计算 应 用 


应 用 发 展 的 主要 障碍 。 此外, 发 展 高 怕 


的 高 性 能 计算 总 资源 还 不 能 满足 


必须 改善 跨 学 科 的 教育 和 培训 以 及 国 


人 多 > 上 


多 本 以 


调查 报告 


国内 用 户 的 需要 。 尽管 中 
部 分 用 户 却 难 以 获得 足够 的 计算 资源 , 许多 应 上 
主 知识 产权 的 软件 的 缺乏 是 中 
的 生态 环境 也 有 待 建 并 。 
家 信息 网 络 基础 设施 的 性 能 和 服 


日 基 


国 已 经 拥有 一 些 性 能 很 高 
此 受 限于 计算 
国 高 性 
Ph 国 已 经 意 1 
务 , 并 建立 一 个 有 效 机 


能 计算 
有 到 ， 


制 来 促进 计算 机 硬件 、 并 行 算法 、 软 件 工程 和 高 性 能 计算 应 用 等 方面 的 研究 人 员 之 间 的 短期 

和 长 远 合作 。 

从 应 用 领域 来 看 ， 中 国 表 10. 世界 TOP500 外 10 万 亿 次 / 秒 以 上 
人 ee 计算 机 应 用 领域 的 比较 

10TFlops 级 以 上 的 大 型 高 性 能 计算 类别 十 容 TODG0 中国 Cir ES 

系统 主要 分 布 在 能 源 、 信 息 服务 和 一 一 

科学 计算 方面 。 表 10 是 世界 i 185 37.00% 10 18.50% 

TOP500 计算 机 和 中 国 10 万 亿 次 / 7 56 11.20% 21 38.90% 

秒 以 上 计算 机 应 用 领域 的 比较 ， 以 “和 WO 0 

及 拥有 世界 TOP500 计算 机 最 多 的 电信 En 

9 个 国家 在 应 用 领域 的 比较 。 从 这 多 融 OO 

些 数据 可 以 得 出 一 些 结论 ; 政府 应 用 8 1.60% 5 9.30% 

工业 制造 70 14.00% 0 0.00% 

@ 中国 用 于 科学 计算 研究 的 高 性 ”信息 服务 103 20.60% 11 20.40% 
能 计算 机 比例 偏 少 。 世 界 合计 500 100.00% 54 100.00% 
TOP500 计算 机 中 37% 安 装 在 
国家 实验 室 、 大 学 、 公 共 超 级 计算 中 心 用 于 科学 计算 ,并且 其 中 几乎 时 括 了 最 强大 的 计 
算 机 系统 ， 而 中 国 用 于 科学 计算 的 高 端 计算 机 不 到 20%。 

@ 中国 用 于 金融 业 和 制造 业 的 高 性 能 计算 机 比例 偏 少 。2008 年 12 月 的 世界 TOP500 系统 
中 ，58 台 计 算 机 用 于 金融 业 ，70 台 用 于 工业 制造 ， 包 括 航天 航空 、 汽 车 、 建 筑 、 医 药 、 
半导体 工业 、 计 算 机 硬件 和 系统 设计 等 ， 而 中 国 仅 1 台 超 过 10 万 亿 次 计算 机 用 于 金融 
业 ， 制 造 业 几乎 是 空白 。 

@ 中 国 虽 有 11 台 超 级 计算 机 用 于 信息 服务 业 ， 但 其 中 却 有 6 台 在 游戏 公司 ， 而 世界 上 主 
要 用 于 信息 处 理 与 服务 和 企业 管理 。 

@ ”中 国 用 于 能 源 领域 的 高 性 能 计算 机 比例 很 高 。 这 与 中 国 的 石油 企业 的 强大 和 国家 能 源 战 
略 是 密切 相关 的 。 

如 表 11 所 示 ，2008 年 12 月 的 TOP500 中 ， 有 447 台 安 装 在 9 个 国家 。 与 其 他 8 个 国 

家 相 比 ， 中 国 在 科学 计算 和 制造 业 领 域 的 应 用 方面 相对 薄弱 。 

表 11. 拥有 世界 TOP500 计算 机 最 多 的 国家 分 应 用 领域 的 比较 
类 别 美国 英国 法 国 德国 日 本 中 国 意大利 印度 ”俄国 
科学 计算 84 12 8 14 14 3 7 6 7 
能 源 / 地 球 物理 46 2 4 1 
气 名 5 1 1 1 
电信 1 1 1 5 2 
金融 35 8 7 3 1 
政府 应 用 6 1 
工业 制造 57 6 到 1 
信息 服务 57 18 7 5 3 2 
合计 291 45 26 24 18 15 12 8 8 


42 


第 9 卷 第 4 期 信息 技术 快报 Vol.9 No.4 

Information Technology Letter Jul. 2011 
在 应 用 高 性 能 计算 求解 问题 的 规模 上 , 中 国 和 世界 先进 水 平 的 差距 更 大 。 除 Linpack 外 ， 
中 国 尚 未 有 求解 十 万 亿 次 以 上 规模 应 用 问题 的 实例 ,而 美国 和 欧洲 已 经 有 许多 百 万 亿 次 量 级 
的 应 用 。 当 前 在 先进 国家 的 百 万 亿 次 计算 机 上 ,会 有 上 万 个 处 理 器 并 行 工作 。 中 国 目 前 应 用 
的 并 行 计算 规模 ， 绝 大 多 数 只 用 到 几 十 到 几 百 个 处 理 器 , 只 有 极 少数 应 用 能 用 好 上 王 个 处 理 
器 。 中 国 的 硬件 研制 能 力 与 软件 应 用 水 平 差 一 到 两 个 数量 级 。 因 此 ,中 国 如 何 用 好 王 万 亿 次 
计算 机 ， 充 分 发 挥 它们 应 有 的 作用 ， 显 然 是 一 个 大 问题 。 


上 述 问 题 与 中 国 在 高 性 能 计算 领域 长 期 以 来 重 便 件 、 轻 软件 、 更 轻 应 用 的 政策 是 分 不 开 
的 。 中 国 的 科技 计划 还 没有 对 一 个 应 用 软件 或 一 个 并 行 算法 项 目 投入 超过 王 万 人 民 币 的 例 
子 。 国 内 学 者 认为 ， 在 软件 开发 的 政府 资助 方面 中 国 应 该 向 日 本 学 习 。 对 于 个 人 用 户 来 说 ， 
软件 应 该 是 免费 的 。 而 对 于 企业 用 户 ， 则 应 该 收取 一 定 费 用 。JASMIN 和 PHG 这 样 的 应 用 
平台 ， 应 该 得 到 政府 的 大 力 资助 ， 从 而 获得 持续 发 展 。 男 外 ， 超 大 规模 并 行 (VLSP〉 的 t 
究 平台 也 叹 需 获得 国家 资助 和 支持 。 


10.3 ”国家 长 远 规划 


高 性 能 计算 作为 国家 的 战略 支撑 技术 , 它 的 研究 和 建设 是 政府 行为 , 需要 制定 国家 规划 ， 
并 给 予 长 期 稳定 的 资金 投入 。 美 国 通过 在 1983 年 实施 的 “战略 计算 机 (SCP) 计划 ”、 1993 
年 实施 的 “高 性 能 计算 与 通信 (HPCC) 计划 ” 1996 年 实施 的 “加 速 战 略 计 算 创新 (ASCI) ” 
计划 及 随后 的 “先进 模拟 和 计算 (ASC) ”计划 ， 对 高 性 能 计算 的 持续 发 展 进 行 部 署 。2005 
年 6 月 ， 美 国 总 统 信息 技术 咨询 委员 会 (PITAC) 提交 了 《计算 科学 : 确保 美国 竞争 力 》 报 
告 ， 再 次 将 高 性 能 计算 的 战略 地 位 提升 到 国家 核心 科技 竞争 力 的 高 度 。 


中 国 目 前 对 高 性 能 计算 尚 没有 一 个 互相 关联 的 统一 规划 ,缺乏 一 个 有 效 的 、 长 远 的 国家 
目标 ， 缺 少 对 国家 行为 的 有 效 规划 和 组 织 。 突 出 的 问题 表现 在 : 


@ 在 国家 层面 没有 达到 美国 、 日 本 的 重视 程度 ， 没 有 国家 级 整体 科技 规划 ; 

@ 国家 缺乏 对 高 性 能 计算 机 核心 技术 的 研发 投入 ， 把 技术 创新 与 满足 用 户 生产 性 需求 
经 常 混同 起 来 ; 

@ 在 国家 的 整体 部 署 上 各 自 为 战 ， 缺 乏 整体 考虑 。 比 如 973、 自 然 科 学 基金 、863、 产 
业 化 项 目 之 间 缺 乏 统一 协调 ;对 高 性 能 计算 应 用 的 投入 严重 汪 后 于 系统 开发 ， 高 性 
能 计算 系统 研发 、 计 算 基 础 设施 平台 建设 和 应 用 程序 开发 由 关注 重点 不 同 的 多 个 阐 
门 负责 ， 因 而 无 法 形成 协同 效应 ; 

@ 当前 ， 中 国 的 高 性 能 计算 系统 中 机 群体 系 结构 占 主 要 地 位 ， 这 是 因为 在 开发 阶段 应 

用 需求 没有 被 充分 考虑 。 这 样 ， 就 无 法 提供 有 效 的 相应 高 端 系统 以 满足 对 系统 性 能 

要 求 很 高 的 一 些 重大 应 用 的 特殊 需求 。 


11 挑战 与 机 遇 


11.1 ”挑战 ，Exascale 级 计算 技术 的 竞争 


1986 年 世界 上 最 快 计算 机 Cray2 达到 1Gflops (十 亿 次 每 秒 )，1997 年 世界 上 最 快 计 算 
机 Intel ASCI Red 达到 1Tflops( 万 亿 次 每 秒 )，2008 年 世界 上 最 快 计算 机 IBM Roadrunnner 
达到 1Pfolops〔 千 万 亿 次 每 秒 )， 高 性 能 计算 机 技术 在 22 年 从 G 级 计算 ,到 工 级 计算 ， 再 
到 了 级 计算 ， 从 现在 到 2020 年 世界 各 国 的 竞争 是 E 级 (Exascale， 百 亿 亿 次 每 秒 ) 计算 。 
光 靠 摩尔 定律 和 大 规模 并 行 已 经 不 足以 实现 这 一 目标 ， 必 须 依 赖 器 件 的 革命 和 编程 的 革命 。 


当前 ， 无 论 是 从 单个 CPU 的 计算 能 力 ， 还 是 从 访 存 与 通信 带宽 来 看 ， 现 有 硬件 实现 技 
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术 还 远 没 有 达到 实现 Exascale 级 系统 所 需 的 能 力 。 首 先 ,芯片 引 脚 数 的 限制 使 得 在 现 有 封装 
技术 下 无 法 达到 所 需 的 通讯 带宽 延迟 比 。 访 存 延 迟 与 带宽 的 性 能 需要 至 少 联合 提高 1000 倍 
才 有 可 能 满足 Exascale 级 系统 的 要 求 ， 再 者 ， 虽 然 从 ITRS ”预测 的 工艺 路 线 图 中 可 以 看 出 
未 来 集成 电路 工艺 尺寸 、 工 作 电压 、 计 算 能 耗 比 等 重要 参数 会 持续 减 小 , 但 是 如 何 保证 在 额 
定 功率 下 设计 并 实现 包含 上 千 个 核 的 CPU 是 一 个 极 具 挑战 性 的 问题 。 总 之 ， 需 要 在 物理 器 
件 层 面 取得 突飞猛进 的 提高 ，3D 封装 、 新 半导体 材料 、 光 互 连 等 更 多 新 兴 技 术 需 要 取得 突 
人 破 。 


每 一 次 编程 技术 的 革命 都 推动 着 高 性 能 计算 的 发 展 。Fortran 使 得 计算 科学 成 为 理论 
究 、 实 验 科学 外 的 第 三 种 科学 发 现 手段 ，Vector 和 OpenMP 使 得 并 行 成 为 可 能 ， 并 行 度 达到 
十 数量 级 ; MPI 使 得 大 规模 并 行 成 为 可 能 ， 并 行 度 达到 百 、 千 、 万 数量 级 。 那 么 什么 样 的 并 
行 编程 能 使 得 超大 规模 并 行 《VLSP) 成 为 可 能 ， 并 行 度 达 到 百 万 、 亿 数量 级 呢 ? 什么 样 的 
高 层 抽象 并 行 编程 方法 能 让 广大 程序 员 鸭 驭 复杂 层次 的 并 行 系统 呢 ? 


未 来 五 到 十 年 内 MPI，OpenMP 作为 主流 并 行 编程 环境 的 地 位 不 会 受到 动 授 。UPC、 
Co-array Fortran、Cray Chapel、IBM X10、Sun Fortress、CUDA、OpenCL 等 这 些 编程 语言 
都 还 远 不 是 一 种 理想 的 并 行 编程 语言 ， 还 在 继续 发 展 。 从 算法 和 应 用 的 角度 ， 设 计 出 与 忆 
级 系统 体系 结构 适应 的 多 层次 细 粒 度 的 并 行 算法 的 任务 将 变 得 更 为 复杂 、 艰巨 ; 随 着 系统 规 
模 的 增加 问题 规模 也 要 增 大 , 否则 同步 开销 将 抹杀 并 行 效果 ; 非 规 则 访 存 也 是 要 解决 的 问题 。 


在 玉 级 计算 的 竞争 中 ， 中 国 与 美国 、 日 本 相 比 ， 在 器 件 和 编程 上 都 不 占 优势 ， 中 国 的 
战略 、 技 术 路 线 和 研究 重点 应 注意 以 下 3 个 方面 : 


@ 速度 和 市 场 同步 增长 : 过 去 20 年 中 国 高 性 能 计算 机 的 速度 与 市 场 规模 是 同步 增长 
的 ， 而 卫 级 计算 这 样 的 高 端 技 术 用 户 群 狭小 ， 缺 乏 足 够 的 市 场 支撑 。 中 国 应 学 习 美 
国 的 UHPC 计划 , 在 发 展 E 级 计算 的 同时 ， 更 加 注重 P 级 的 单机 柜 系 统 和 工 级 的 可 
移动 高 性 能 计算 设备 。 另 外 ， 发 展 匡 级 计算 的 技术 应 考虑 同时 满足 高 通 量 计算 的 需 

求 。 

@ 速度 和 用 户 群 同步 增长 : 过 去 20 年 中 国 高 性 能 计算 机 的 速度 与 用 户 群 也 是 同步 增长 
的 。 机 群 技术 路 线 在 普及 高 性 能 计算 上 起 到 十 分 重要 的 作用 。 中 国 必须 坚持 机 群 技 
术 路 线 ， 将 低 成 本 、 易 用 、 易 编程 放 到 最 重要 的 位 置 ， 重 点 发 展 与 个 人 高 性 能 计算 

rr 机 相关 的 软件 技术 ， 并 将 玉 级 计算 的 主要 技术 用 到 个 人 高 性 能 计算 机 中 。 

@ 玉 级 计算 的 应 用 中国 应 发 展 有 自己 特色 的 EE 级 计算 应 用 ， 在 满足 国家 重大 需求 的 
技术 创新 中 采用 高 性 能 计算 技术 。 
11.2 机遇: 并 行 软件 成 为 市 场 主流 

在 过 去 的 几 十 年 里 , 单 处 理 器 的 速度 一 直 按 照 摩 尔 定律 快速 发 展 , 但 是 未 来 将 无 法 延续 

这 种 趋势 ， 面 向 众 核 体系 结构 和 发 挥 片 内 并 行 性 的 并 行 软件 将 成 为 未 来 提高 性 能 的 主要 方 

向 。 并 行 软件 将 成 为 市 场 主流 ， 这 是 中 国 在 高 性 能 计算 领域 走向 世界 的 机 遇 。 

在 科学 与 工程 计算 领域 ,由 于 软件 市 场 长 期 完全 由 国外 软件 所 秦 断 , 许可 费用 昂贵 ( 表 

12)。 随 着 高 性 能 计算 普及 时 代 的 到 来 ， 中 国 经济 从 应 用 技术 走向 创造 技术 ， 科 学 与 工程 计 

算 并 行 软件 市 场 会 扩大 几 个 数量 级 。 中 国 应 抓 住 这 一 机 会 ， 大 力 发 展 并 行 应 用 软件 产业 。 

男 一 方面 ， 战 略 性 的 、 高 水 准 的 工业 工程 数值 模拟 ， 如 大 飞机 设计 ， 和 迫切 需要 高 水 平 的 

自主 开发 的 大 规模 并 行 软件 。 目 前 市 场 上 的 国外 软件 大 多 发 展 于 半 个 世纪 前 , 软件 框架 未 能 


14 International Technology Roadmap for Semiconductors， 国 际 半导体 技术 路 线 图 
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考虑 现在 及 未 来 的 超大 规模 计算 需求 。 特别 是 前 处 理 部 分 , 已 经 被 证 明成 了 大 规模 计算 时 的 


严重 瓶 希 。 


软件 架构 已 不 适应 新 型 体系 结构 ， 需 要 重新 设计 ， 这 也 正 是 ， 


国 的 机 遇 。 


此 外 ， 基 于 互联 网 的 应 用 模型 ， 如 云 计算 以 及 其 他 更 广泛 的 计算 模型 ， 将 会 改变 传统 的 


操作 系统 的 角色 。 操作 系 统 将 会 成 为 基于 互联 网 的 系统 
面向 大 众 的 低 成 本 


的 高 性 能 


本 


长 


的 一 小 部 分 。 新 的 商业 模式 也 给 发 


计算 软件 带 来 了 机 会 。 例 如 , NewServers 公司 提出 了 Hardware as 
a Service (HaaS， 硬 件 即 服务 ) 的 概念 ， 使 得 企业 可 以 通过 NewServers 公司 的 数据 中 心 来 


维护 可 扩展 的 、 可 负担 表 12. 国外 软件 在 中 国 市 场 上 并 行规 模 和 售 价 〈 估 计 ) 统计 
的 、 安 全 的 自己 的 数据 中 ee 许可 证 年 费 或 
心 ，Gompute 公司 提供 了 软件 名 称 价格 (万 元 并行 规模 年 技术 支持 费 
以 一 种 按 需 的 高 性 能 计 ANSYS CFX&FLUENT 1000 128 
算 使 用 方法 ， 允 许 用 户 通 ABAQUS 360 64 18% 
过 互联 网 使 用 高 性 能 的 MSC Nastran 520 32 
计算 资源 ， 并 按照 实际 使 MSC Dytran 100 
用 的 资源 付费 ;Mellanox MSC Patran 160 
公司 提出 了 HPC as a Gaussian 50 - 10 
Service (HPCaaS, 高 性 能 LS-DYNA 127 128 38 
计算 即 服务 ) 的 概念 ， 为 Matlab 开发 工具 67 128 = 
用 户 提供 更 加 灵活 和 有 
效 的 高 性 能 计算 能 力 。 学 习 这 些 商业 模式 ， 中 国 的 高 性 能 计算 软件 可 以 迅速 地 走向 世界 。 
12 结论 

中 国 的 高 性 能 计算 发 展 了 半 个 多 世纪 ， 国 家 在 必 片 、 硬 件 、 系 统 设计 和 基础 设施 如 网 络 
和 计算 中 心 等 方面 有 了 大 量 的 投入 。 最近, 地 方 政府 也 积极 参与 进来 , 提供 了 强 有 力 的 支持 。 
正 是 这 样 全 方位 的 协同 努力 ， 我 国 研制 出 了 目前 世界 上 最 快 和 若干 名 列 前 茅 的 超级 计算 机 ， 
其 中 至 少 有 一 台 将 采用 国产 高 性 能 处 理 器 。 这 样 的 发 展 还 是 得 益 于 政府 研究 项 目 资助 , 用 户 
(尤其 是 商业 界 的 ) 在 其 中 发 挥 的 作用 还 非常 少 。 

国产 高 性 能 计算 机 企业 在 中 国 市 场 正 形成 了 对 国际 大 公司 如 IBM、 惠 普 的 挑战 。 如 果 
只 考虑 硬件 因素 ， 我 国 与 美国 、 日 本 的 差距 约 1-2 年 。 我 国 在 体系 结构 和 软件 方面 的 创新 急 
需 加 强 ， 这 也 是 国内 高 性 能 计算 的 短 板 ， 涉 及 到 应 用 和 系统 软件 各 个 层次 。 目 前 ， 我 国 几 乎 
没有 具有 国际 竞争 力 的 国产 软件 , 但 国外 软件 高 昂 的 授权 费用 和 出 口 限 制 迫 使 我 们 必须 开发 
自己 的 软件 产品 。 最 近 出 现 的 新 的 研究 ， 包 括 基 于 GPU 的 软件 开发 和 面向 大 规模 数据 处 理 
应 用 ， 很 值得 重视 。 目 前 ， 在 大 量 商用 组 件 、 产 品 和 服务 的 流行 的 形势 下 ， 日 益 重 要 的 大 规 
模 数据 处 理 问题 将 为 我 国 确立 真正 有 竞争 力 的 品牌 提供 重要 的 机 遇 。 
致谢 

国家 智能 计算 机 研究 开发 中 心 的 许多 研究 生 和 员工 参与 了 调查 和 本 文 的 写作 与 校对 工 


作 ， 在 此 一 并 致谢 ! 
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附 表 A: 神威 新 世纪 -64P (已 停 用 ) 系统 配置 
系统 峰值 302.4Gflops 
计算 结 点 32 个 双 P4 Xeon 处 理 器 
服务 结 点 1 个 双 P4 Xeon 处 理 器 
CPU Intel P4 Xeon, 2.4 GHz， 总 共 66 CPU 
系统 内 存 总 容量 66GB 
磁盘 总 容量 2.7TB 
体系 架构 Cluster、 Gig-Ethernet 
操作 系统 Redhat Linux 7.3 
上 海 超 算 中 心 使 用 的 商业 软件 列表 
软件 名 称 描述 相关 网 站 
ELUENT 通用 计算 流体 力学 分 析 软 件 www.fluent.com 
LS-DYNA 瞬 态 响应 动力 学 分 析 软 件 Www.ansys.com 
PAM-CRASH 瞬 态 响应 动力 学 分 析 软 件 Www.esi-group.com 
ANSYS.Multiphysics 多 物理 场 耦合 分 析 软 件 Www.ansys.com 
NASTRAN 通用 有 限 元 分 析 软 件 www.mscsoftware.com 
MARC 非 线 性 有 限 元 分 析 软 件 www.mscsoftware.com 
FEKO 高 频 电 磁场 分 析 软 件 www.feko.info 
STAR-CD 通用 计算 流体 力学 分 析 软 件 www.cd-adapco.com 
CFX 通用 计算 流体 力学 分 析 软 件 Www.ansys.com 
OPTIMUS 过 程 集成 与 优化 设计 软件 www.optimus.pl 
HyperWorks 有 限 元 前 后 处 理 和 优化 设计 软件 “www.altair.com 
ABAQUS 非 线 性 有 限 元 分 析 软 件 www.abaqus.com.cn 
IDEAS 有 限 元 分 析 及 前 后 处 理 软 件 Www.ugs.com.cn 
ICEM-CFD CED 前 后 处 理 软 件 www.ansys.com 
AI*ENVIRONMENT CAE 前 后 处 理 软件 Www.ansys.com 
GAMBIT FLUENT 配套 前 处 理 软件 www.fluent.com 
MasterFEM 有 限 元 前 后 处 理 软件 www.ugs.com.cn 
Medina 有 限 元 前 后 处 理 软 件 www.oracle.com 
Oracle 数据 库 软 件 
GEFEP-P 汽车 碰撞 并 行 仿真 软件 
CADEM-P 汽车 覆盖 件 冲 压 并 行 仿真 软件 
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附 表 C: 上 海 超 算 中 心 使 用 的 科学 计算 应 用 软件 列表 
序号 ”软件 名 称 描述 说 明 


1 QCHEM ”量子 化 学 计算 软件 
2 NWCHEM 量子 化 学 计算 软件 源 代码 
3 GAUSSIAN 量子 化 学 计算 软件 
4 MOLPRO 量子 化 学 计算 软件 
5 GAMESS ”量子 化 学 计算 软件 开源 代码 
6 CPMD 分 子 动力 学 从 头 计算 程序 源 代码 
7 ABINIT 电子 结构 计算 程序 开源 代码 
8 VASP 分 子 动力 学 模拟 
9 SIESTA 分 子 和 国体 的 电子 结构 计算 和 分 子 动力 学 模拟 开源 代码 
10 WIEN2K 固体 电子 结构 计算 
11 ESPRESSO 分 子 动力 学 模拟 
12 SMEAGOL 分 子 动力 学 模拟 
13 NAMD 分 子 动力 学 计算 程序 
14 EGO 分 子 动力 学 程序 
15 GROMACS 分 子 动力 学 通用 软件 包 开源 代码 
16 DOCK 分 子 对 接 程序 
17 BLAST 序列 相似 性 检索 程序 
18 MMS5 有 限 区 域 的 非 静 力 平衡 的 中 尺度 数值 模式 的 计算 程序 
19 GRAPES ”全 球 和 区 域 气象 分 析 预 报 系 统 中 国 气 象 局 研发 
20 FDS 火灾 模拟 程序 源 代码 
21 COSMOMC 天 体 物理 计算 


附 表 D: CGGVeritas 和 BGP 的 计算 机 对 比 
年 代 


(计算 机 CGGVeritas ee 
变革 ) 

1970 1966 年 : CGG 建立 第 一 个 处 理 中 心 ， 1973 年 : 建立 第 一 个 处 理 中 心 ， 使 用 

(主机 + 数 ”使 用 SDS9300 计算 机 150 计算 机 

组 处 理 机 ) 1972 年 : 开发 GeoMaster 软件 1977 年 : 引进 Cyber172-4 机 +MAP II 

1980 1980 年 : DIGICON 开发 DISCO 人 处理”1983 年 : 引进 IBM3033+3838 

( 癌 量 计算 ”系统 运行 在 DEC VAX 11/780 上 1986 年 : 建立 YH-1 巨型 机 地 震 数据 

机 ) 1984 年 : CGG GeoVector (CRAY 批 ”处理 系统 
量 处 理 版 本 )〉 软件 安装 在 当时 最 大 计 1987 年 : 开发 PE3284+AP2704 多 数 
算 机 Cray 1S 上 组 处 理 机 多 辅 处 理 机 地 震 数 据 处 理 系 


1988 年 : DIGICON 开始 研究 MPP， 统 
并 开发 新 的 处 理 系 统 SeismicTANGO ”1987 年 : 引进 IBM3081+3838 
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附 表 DD( 续 ) 


1990 1991 年 : CGG GeoVectorPlus 将 批量 
(工作 站 和 和 交互 处 理 集 成 在 UNIX 平台 上 运行 ”1991 年 : 引进 IBM3084+3838 
并 行 计算 ”1994 年 : CGG 并 行 GeoVector 运行 在 ”1992 年 : GRISYS 在 UNIX 平台 上 运 
机 ) Convex SPP1000 上 行 
1996 年 : CGG GeoVector 支持 IBM， 1995 年 : 引进 IBM SP2 并 行 机 
SGI，SUN 和 HP 平台 
ee 2001 年 : GeoCluster 在 PC 机群 上 运行 了 下 安装 蝇 光 ODED 
(机 群 计算 2002 年 :GeoCluster1.1 全 面 取代 了 人 
机 ) 2003 年 : 安装 曙光 4000L 机 群 地 震 数 
GeoVectorPlus 本 据 处 理 系统 
2005 年 。 Geogast 系统 在 PC 机理 上 
运行 
> 作者 简介 : 
| 孙 凝 晖 研究 员 ， 中 国 科 学 院 计 算 技术 研究 所 常务 副 所 长 。 主 要 从 事 计 算 
机 体系 结构 方面 研究 ， 发 表 论 文 100 多 篇 ， 现 担任 中 国 计 算 机 学 会 高 性 
能 计算 机 专 委 会 副 主任 、 中 国 科学 技术 大 学 客座 教授 , 《计算 机 学 报 》 
主编 , 《Journal of Computer Science and Technology》 领 域 编 委 。 
作为 项 目 负 责 人 ， 于 1999 年 获 中 国 科学 院 青年 科学 家 奖 一 等 奖 ，2001、 


2003、2006 年 三 次 荣获 国家 科技 i 步 二 等 疾 ，2005 年 获 中 国 科学 院 术 出 
科技 成 就 奖 ， 并 于 2006 年 获得 “中 国 青 年 科技 奖 ” 和 “中 国 十 大 杰出 社 


年 ” 麻 溃 称 与 。 


山 


ll 


计算 机 体系 结构 国家 重点 实验 室 颁 牌 


和 公 科技 部 、 教 育 部 、 中 科 院 、 中 国 工 程 院 、 国 家 自然 基金 委员 会 于 2011 年 5 月 23 
到 日 共同 在 北京 召开 全 国 基础 研究 工作 会 议 ， 会 上 ， 为 24 个 新 建国 家 重点 实验 室 举行 了 
颁 牌 仪式 。 计 算 所 常务 副 所 长 孙 凝 晖 从 科技 部 副 部 长 王志刚 手中 接 过 “计算 机 体系 结构 


国家 重点 实验 室 ” 的 牌 区 。 


To a hen 
室 261 个 ， 试 点 国家 试验 室 6 个 。 据 悉 ， 今 年 召开 的 全 国 基础 研究 工作 会 议 是 继 1989 


全 


FE、2000 年 以 来 召开 的 第 三 正 东 、 Wo 


做 重要 讲话 。 


基础 研究 的 战略 意义 和 重要 作用 得 到 了 前 所 未 有 的 广泛 共识 和 高 度 重视 , 中 央 财 政 
对 基础 研究 的 投入 大 幅 增长 ,为 基础 研究 发 展 提供 了 重要 保障 ; 学 科研 究 体 系 更 加 完备 ; 
创新 基地 建设 成 效 显 著 ; 人 才 队 伍 不 断 壮大 ; 基础 研究 整体 水 平 大 幅 提 升 ， 基础 研究 引 
领 经 济 社会 发 展 的 能 力 不 断 增强 。 


次 全 国 性 基础 研究 工作 大 会 。 刘 延 


( 选 自 http://www. ict. cas. cn《 计 算 所 新 闻 》) 
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